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и советами целого ряда лиц. Наиболее су- 
щественные замечания и предложения были 
высказаны Ф. А. Дрейзиным, Л. Н. Иор- 
данской, Б.А. Трахтенбротом, А. И. Фе- 
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тана Ю. Д. Апресяном, А. Я. Диковским, 
А. А. Зализняком, О. С. Кулагиной, 
3. К. Литвинцевой, Е. В. Падучевой, 
В. А. Успенским, Л. Л. Холодовичем 'Ю. А. 
Шрейдером и другими, от которых мы 
также получили немало ценных соображе- 
ний. Всем эти лицам мы выражаем нашу 
искреннюю признательность. Их советы 
мы постарались учесть, что, впрочем, уда- 
лось нам не в полной мере. Ответственность 
за те или иные недостатки книги лежит, 
разумеется, целиком ‘на авторах. 


Академгородок — Гольяново, 
март 1964 г. — март 1967 г. 


Введение 


Цель настоящей книги — кратко охарактеризо- 
вать относительно недавно возникшую область иссле- 
дований, известную под названием «математическая 
лингвистика». Сделать это, однако, непросто. Когда 
нужно ответить, например, на вопрос «Что такое 
дифференцирование?» или «Что такое топология?», 
речь идет лишь о том, чтобы найти максимально до- 
ступную и эффективную форму изложения вещей, 
прекрасно известных специалистам, понимаемых 
всеми ими одинаково, так сказать, канонизирован- 
ных. Математику, взявшемуся объяснить неподготов- 
ленному читателю, что такое дифференцирование, 
разумеется, не придется спачала решать этот вопрос 
для себя: ответ он хорошо знает заранее и должен 
заботиться лишь о методической стороне изложения 
(что, конечно, и само по себе представляет задачу 
весьма нелегкую). В нашем случае дело обстоит 
иначе. Математическая лингвистика — это дисцип- 
лина совсем молодая, находящаяся в процессе ста- 
новления и еще не успевшая обзавестись традициями. 
Общепринятой точки зрения на ее задачи, методы и 
тем более границы и рамки не существует. Поэтому 
мы были вынуждены в известной степени заново вы- 
рабатывать некоторую точку зрения на эту область 
в целом, выяснять ее общее строение, пытаться наме- 
тить ее статус. Тем не менее, данная книга не является 
оригинальным исследованием; она представляет со- 
бой популяризацию, но популяризацию не вполне 
обычную: в ее основу положены не более или менее 
традиционные концепции, в данном случае отсутет- 
вующие, а некоторая общая картина математической 
лингвистики, предлагаемая самими авторами. (Мы ни 
в коей мере не претендуем ни на окончательность, 


") 
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ни на единственность этой картины. Возможны, ко- 
нечно, и другие подходы, ср., например, Р]а{В 1961; 
авторы, однако, воздерживаются от их обсуждения.) 

Уже из самого названия математической лингви- 
стики видна ее связь как с математикой, так и с линг- 
вистикой (иначе — языковедением, или языкозна- 
нием, т. е. наукой о естественных языках). Поэтому 
авторы стремились сделать эту книгу «читабельной» 
и для математиков, и для лингвистов. При этом ос- 
новной читатель, на которого ориентируются авто- 
ры, — лингвист. Такой выбор не случаен. Во-первых, 
математическая лингвистика, как она понима- 
ется в этой книге, еть математическая дис- 
циплина; стало быть, если мы хотим, чтобы с ней могли 
знакомиться и лингвисты, и математики, надо рассчи- 
тывать изложение на лингвистов, как находящихся 
в худшем положении: все, что поймет здесь лингвист, 
поймет в большинстве случаев и математик, но не 
наоборот. Во-вторых, именно лингвист в первую оче- 
редь заинтересован в содержательной интерпретации 
и приложениях построений математической лингви- 
сТики. 

В связи со сказанным авторы строили изложение 
так, чтобы от читателя формально не требовалось 
никаких специальных математических знаний — все 
используемые понятия, вплоть до самых простых, 
обязательно разъясняются. Тем` не менее следует 
честно признать, что для подлинного понимания со- 
держания настоящей книги крайне желательно сво- 
бодное владение некоторыми простейшими, но вместе 
стем фундаментальными математическими понятиями, 
например понятиями множества и функции, а также 
элементарными приемами математических рассуж- 
дений; в частности, полезно иметь привычку к таким 
понятиям, как необходимое условие, достаточное 
условие, доказательство по индукции и т. п. Повторя- 
ем: все это не является, строго говоря, необходимым; 
однако по существу без этого обойтись трудно, хотя 
и можно — ценой затраты гораздо ббльших усилий 


*) О знаках на полях — см. стр. 14. 
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(поскольку по ходу чтения книги читатель все равно 
должен будет овладеть всеми указанными понятиями), 

Вообще следует подчеркнуть, что лингвист, же- 
лающий так или иначе применять математику в своей 
исследовательской деятельности, нуждается в нер- 
вую очередь именно в общематематической культуре, 
в привычке к математическому мышлению, а не 
в техническом аппарате математики. 

Для чтения книги полезно также знакомство 
с современной структурной лингвистикой (работы 
Л. Ельмслева, Л. Блумфилда, 3. Харриса, Н. Тру- 
бецкого, Р. Якобсона и др. *)); прямого отношения 
к математической лингвистике соответствующие ис- 
следования не имеют, однако именно они во многом 
подготовили почву для ее возникновения, выдвинув 
ряд понятий и представлений (ср., например, идею 
непосредственно составляющих), образовавших со- 
держательную базу для формальных моделей мате- 
матической лингвистики. 

Особое место здесь занимают работы Н. Хомского 
и его школы. В отличие от упомянутых выше эти 
работы либо непосредственно относятся к математи- 
ческой лингвистике, либо тесно с ней связаны по 
существу. Более того, именно они дали первоначаль- 
ный толчок к ее развитию, что позволяет считать 
Н. Хомского основоположником этой новой дисцип- 
лины. Естественно поэтому, что значительная часть 
книги ($$ 2, 3, 4 и частично $ 5) посвящена в основном 
изложению учения Н. Хомского о формальных по- 
рождающих грамматиках. Следовательно, знаком- 
ство с соответствующими работами будет чрезвычай- 
но полезно. В первую очередь это относится к книге 
Н. Хомского «Синтаксические структуры» (Хомский 
1962); см. также Хомский 1965а, Хомский 19656, 
и Хомский — Миллер 1965; для математика можно 
рекомендовать еще Хомский 1966. 

Однако сказанное выше о математических зна- 
ниях относится и к наличию специальной лингви- 


*) Прекрасным введением в проблематику и методологию 
структурной лингвистики может служить книга Ю. Д. Апре- 
сяна (Апресян 1966). См. также Глисон 1959. 
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стической подготовки: строго говоря, оно также не яв- 
ляется обязательным— все существенные для изложе- 
ния понятия и факты, выходящие за рамки школь- 
ной грамматики, поясняются. 

Итак, чего же авторы требуют от читателя? Фор- 
мально — ничего, т. е. никаких математических или 
лингвистических знаний; по существу же предпола- 
гается некоторая математическая и лингвистическая 
грамотность. (Эта ситуация в книгах по математике 
довольно обычна: нередко сложные монографии, 
чтение которых требует больших усилий даже от 
специалиста, начинаются формально справедливым 
утверждением, что у читателя не предполагается ни- 
каких предварительных знаний.) 

Теперь уточним, что авторы предлагают чита- 
телю. В книжке он найдет очерк основных идей и 
понятий математической лингвистики, который мо- 
жжет служить лишь для предварительного и самого 
общего ознакомления с нею. Если же у него воз- 
никнет желание углубить свое знакомство с матема- 
тической лингвистикой, например, с целью самому 
работать в этой области, то он должен будет обра- 
титься к специальной литературе, часть которой 
указана в конце книги, на стр. 189—193. 

Нам остается еще разъяснить здесь ту методоло- 
гическую установку, на которую опирается все по- 
следующее изложение. Мы имеем в виду вопрос о 
правомерности существенного использования матема- 
тики в такой сугубо гуманитарной области, как изу- 
чение человеческих языков. Если бы книга была рас- 
считана исключительно на математиков, подобное 
разъяснение было бы, по-видимому, излишним; однако 
для многих читателей-лингвистов (а может быть, 
и не только лингвистов) оно, как нам кажется, 
необходимо. Дело в том, что в лингвистике этот во- 
прос неоднократно и еще совсем недавно бурно дис- 
кутировался. При этом целый ряд лингвистов нахо- 
дит, что «математическая лингвистика» есть сош4та- 
Ч1со 11 а4]есфо, что язык и математика несовм с 
тимы и ничего общего между собой не имеют, что- 
попытки внедрить математику в лингвистику ведут 
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к дегуманизации последней и тем самым к ее гибели 
как самостоятельной науки. Сторонники таких взгля- 
дов считают математическую лингвистику «скреще- 
нием псевдолингвистики с псевдоматематикой» (Аба- 
ев 1965, стр. 32). 

Авторы данной книги стоят на прямо противопо- 
ложных позициях. Есть, разумеется, немало плохих 
работ, о которых остроумно замечено, что они пред- 
<тавляют собой попытку применить то немногое, что 
автор знает из математики, к тому немногому, что 
юн знает из лингвистики (Ю. К. Щеглов, устно). 
Однако за эти работы математическая лингвистика 
ответственности не несет — они не имеют к ней ника- 
кого отношения. Что же касается существа дела, то 
мы полностью убеждены не только в возможности, 
но и в необходимости математического описания язы- 
ковых явлений. Мы не можем давать здесь конкретные 
разъяснения по существу этого описания: подобные 
разъяснения и составляют содержание предлагае- 
мой книги. Однако мы настаиваем на том, что любое 
научное описание (в том числе описание языка) 
должно быть логически последовательным (исклю- 
чается пропуск существенных *) звеньев рассузкде- 
ния), однозначным (исключаются формулировки, 
допускающие более одного понимания) и вполне экс- 
плицитным (исключается «контрабандное» привле- 
чение информации, не входящей в описание в явном 
виде). А такое описание и есть формальное, т. е.— 
при достаточно высоком уровне формализации — 
по существу математическое описание. Слово «фор- 
мальный» не означает ничего, кроме как «логически 
последовательный -+ однозначный -- абсолютно яв- 
ный», так что формальное описание отнюдь не исклю- 
част обращения к содержанию, к смыслу (вполне 
возможно, в частности, формальное описание смы- 
сла, см. ниже, стр. 153 и далее). Стало быть, если 
формализацию отождествляют с дегуманизацией, 
видя в этой последней максимально возможное 


*) То есть таких, на автоматическое восстановление 
которых читателем пишущий рассчитывать не может. 
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исключение из описания «человеческого фактора» (т. е. 
субъективного начала, неоговоренного обращения 
к интуиции и сообразительности читателя), то мы — 
за такую дегуманизацию. Подобное исключение 
«человеческого фактора» из описаний есть неотъем- 
лемая часть любого научного метода: без этой «дегу- 
манизации» никакая наука невозможна. | 

Сделаем два существенных разъяснения: 

1. Разумеется, в процессе построе- 
ния описания, в процессе научного творчества ин- 
туиция, сообразительность и т. п., т. е. «человече- 
ский фактор», играют ведущую роль, и этого никто 
не станет отрицать. Речь идет об изгнании «челове- 
ческого фактора» из результатов исследова- 
ния, из самих описаний. 

2. Сказанное выше отнюдь не означает, будто мы 
признаем толькоформализованные («математизирован- 
ные») лингвистические работы, отказывая в ценности 
всем прочим. Ничего подобного! Несомненно, что не- 
достаточно четкое логически исследование, содержа- 
щее новые важныефакты или идеи, может быть, вообще 
говоря, гораздо ценнее, чем безупречная формали- 
зация тривиальной истины. Однако столь же не- 
сомненно, что из двух работ, описывающих один и 
тот же круг фактов с одинаковой полнотой, большую 
ценность представляет та, в которой достигнута более 
высокая степень формализации. 

Таким образом, мы исходим из тезиса о желатель- 
ности дегуманизации лингвистики (в указанном выше 
смысле слова), и тем самым вопрос о возможности ма- 
тематической лингвистики решается утвердительно. 

В связи с признанием необходимости формализа- 
ции лингвистических описаний целесообразно отме- 
тить следующее. 

Формальное описание любого объекта неизбежно 
связано со схематизацией и огрублением наблюдае- 
мой картины *). Человеку, воспитанному в классиче- 


*) Очевидно, что по мере совершенствования наших зна- 
ний об объекте огрубление становится все меньше и меньше, 
а описание все ближе и ближе к действительности. Процесс 
такого приближения является, по-видимому, бесконечным, 
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ских «гуманитарных» традициях, подобный подход 
мозкет показаться порочным. Однако это единственно 
возможный путь научного познания. В самом деле, 
познать некоторый сложный объект не означает ниче- 
го другого, как установить закономерности его строе- 
ния, т. е. выделить составляющие его простые компо- 
ненты и сформулировать правила, по которым эти 
компоненты соединяются между собой. В резуль- 
тате получается именно схема изучаемого 
объекта. 

При этом различные аспекты рассмотрения этого 
объекта обычно приходится разделять. В действи- 
тельности все такие аспекты могут быть тесно свя- 
заны и сложным образом взаимодействовать друг 
с другом. Тем не менее как раз для того, чтобы 
точно описать их взаимосвязь, необходимо сначала 
изучить их по отдельности. Вообще, успех научного 
исследования зависит прежде всего от умения раз- 
бить сложную задачу на более простые (т. е. «схема- 
тизировать» ее) и выделить нужные аспекты анализа 
простой задачи. Разумеется, необходимо, чтобы при 
подобных упрощениях и огрублениях сохранялись 
все существенные — с точки зрения стоящей перед 
исследователем цели — свойства и особенности 
объекта. Лишь в той мере, в какой соблюдается 
это условие, формализация будет полезной и плодот- 
ворной. 

Что же касается конкретных формальных описа- 
ний, предлагаемых математической лингвистикой и 
приводимых в этой книге, то вопрос об их содержа- 
тельной ценности — вполне законный вопрос, но 
в каждом конкретном случае он должен решаться 
особо. Читатель, возможно, найдет, что в тех или 
иных формальных построениях упущены какие- 
либо существенные стороны моделируемых языковых 
явлений. Подобных критических замечаний относи- 
тельно математической лингвистики, действительно, 
можно сделать немало. Однако, па наш взгляд, это 
означает только, что определенные модели нуждаются 
в усовершенствовании или исправлении, и нисколько 
не затрагивает самого принципа формализации, 
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который является основным лозунгом математической 
лингвистики (как и любой другой точной науки). 

Понятие «формального» не является абсолютным: 
возможны различные степени, или уровни, формали- 
зации, между которыми нет резких границ. Разумно, 
однако, выделять два типа формализации: домате- 
матический, когда используемые понятия в большей 
мере сохраняют индивидуальные, содержательные 
особенности конкретного объекта, и математический, 
преднолагающий использование только абстрактных 
сущностей, заданных точными определениями (в этом 
случае для установления связей между абстрактными 
единицами и конкретными объектами нужна специ- 
альная интерпретация). 

Математическая лингвистика имеет дело с форма- 
лизацией второго типа. Однако поскольку формали- 
зация является всегда не самоцелью, а средством 
изучения конкретных явлений, то для всякой точной 
науки, а стало быть, и для математической лингви- 
стики важны не только ее формальные понятия и 
утверждения, но и их интерпретация, т. е. то, как 
эти понятия и утверждения прилагаются к настоя- 
щим объектам. 

В связи с этим авторы стремились насытить изло- 
жение содержательными примерами, показываю. 
щими, как введенные формальные понятия работают 
применительно к реальным языкам. При этом слож- 
ность естественного языка такова, что полное опи- 
сание даже (казалось бы) достаточно простого его 
фрагмента оказывается слишком громоздким для на- 
стоящей книги. Кроме того, построение полных 
(формальных) описаний для тех или иных фрагментов 
естественного языка не относится к собственным за- 
дачам математической лингвистики: она должна лишь 
вырабатывать средства и методы для таких описаний, 
а их применение к языку входит в компетенцию линг- 
вистики как таковой (о соотношении математической 
лингвистики и «просто» лингвистики см. Заключение, 
стр. 174—176). Поэтому наши примеры, как правило, 
являются фрагментарными и носят по преимуществу 
иллюстративный характер. 
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Наконец, мы хотели бы подчеркнуть, что пред- 
лагаемая книга не является ни систематическим 
изложением математической лингвистики, ни 0бзо- 
ром основных работ и результатов в этой области. 
-О некоторых важных направлениях в книге говорит- 
ся лишь вскользь, а многие интересные проблемы 
(и относящиеся к ним результаты) вообще не упомя- 
нуты. Авторы видели свою задачу 
лишь в том, чтобы дать читателю 
общее представление о математи- 
ческой лингвистике. 

В соответствии с этим авторы стремились свести 
к минимуму количество ссылок на литературу, вы- 
бирая в первую очередь наиболее доступные в нашей 
стране и наименее трудные по изложению работы, 
по возможности — на русском языке (для всех при- 
влекаемых иностранных работ, изданных в русском 
переводе, указывается только перевод). 

Таким образом, имеющийся в конце книги список 
упоминаемых работ никоим образом не претендует 
на полноту и не должен рассматриваться как само- 
стоятельный библиографический указатель по мате- 
матической лингвистике; кроме того, в список вклю- 
чен ряд работ, не имеющих прямого отношения к ма- 
тематической лингвистике, но оказавшихся необхо- 
димыми по ходу изложения. 

Поскольку книга, как отмечалось выше, предна- 
значается не только (и даже не в первую очередь) 
для математиков, было сочтено целесообразным все- 
мерно «облегчить» формулировки математических 
утверждений. Поэтому определения и теоремы во 
многих случаях излагаются в свободном стиле, 
вперемежку с содержательными пояснениями и т. п., 
т. е. в непривычной для математика форме (хотя и 
вполне строго по существу). Доказательства, как 
правило, не приводятся. Однако, в интересах чита- 
теля-математика, книга снабжена Приложением 1 
(стр. 177—183), где собраны все математические ут- 
верждения, сформулированные вполне каноничес- 
ким образом; там же даны ссылки на источники, где 
можно найти соотвстествующие доказательства. 
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В книге нет упражнений, однако, чтобы возме- 
стить их отсутствие, авторы в ряде случаев созна- 
тельно опускали некоторые звенья рассуждений 
(не очень существенные для главной линии изложе- 
ния), не проводили полностью выкладок или не за- 
канчивали разбора отдельных примеров в расчете 
на то, что читатель попытается заполнить эти лакуны 
сам. Все подобные случаи оговорены в тексте и от- 
меченя специальным знаком на полях (см. ниже); 
иногда приводятся наводящие соображения. Выпол- 
нение этих «квазиупражнений» не является строго 
обязательным для понимания, хотя, разумеется, чем 
больше их будет сделано, тем лучше читатель овла- 
деет материалом. Следует также иметь в виду, что 
задачи, оставленные на долю читателя, очень различ- 
ны по трудности: от предельно простых до весьма 
нетривиальных. 

С целью направлять внимание читателя авторы 
используют систему специальных знаков на полях: 


В — «обратить особое внимание»; 


— «очень важное звено рассуждений», 
«фундаментальное утверждение»; 


Е \ — «трудное место», «тонкое, но сущест- 
венное различие», «парадоксальный (на 


первый взгляд) вывод»; 


Т; — «утверждение, по существу предотав- 
ляющее собой формулировку матема- 
тической теоремы» (индекс # означает 
номер соответствующей тебремы в При- 
ложении [| — сводке основных мате- 
матических результатов по затронутой 
втексте проблематике); 


и —« квазиупражнение» (см. вышо). 


$ 1. Содержание понятия 
«математическая лингвистика» 
(предварительные соображения) 


Как обычно употребляют термин 
«математическая лингвистика» 


Термин «математическая лингвистика» вошел в 
употребление в середине 50-х годов и к настоящему 
времени получил широкое распространение. Однако 
до сих пор разными людьми он понимается по-раз- 
ному. 

С одной стороны, слова «математическая лингви- 
стика» чаще всего употреблятотся в очень широком и 
весьма расплывчатом смысле, а именно, их применя- 
ют к самым различным лингвистическим исследо- 
ваниям, если в них хотя бы в незначительной степени 
используется математика или даже если малоиску- 
шенным читателям только кажется, будто она исполь- 
зуется. Так, сюда относят и работы по созданию 
математических моделей языка с использованием 
аппарата алгебры, математической логики, теории 
алгоритмов; и работы, связанные со статистикой; 
и работы, где для формулирования тех или иных 
лингвистических положений привлекаются простые 
понятия и способы выражения (или обозначения), 
заимствованные из математики. Сюда же зачисляют 
все лингвистические работы, предполагающие при- 
менение вычислительных машин, в том числе работы 
по автоматическому переводу, даже если в них ма- 
тематика не используется ни по существу, ни по 
форме. Кроме того, под название «математическая 
лингвистика» часто подводятся всевозможные работы 
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прикладного характера и вообще лингвистические 
сочинения, носящие четко выраженный нетрадицион- 
ный характер. 


аз следует употреблять этот термин 


Подобное словоупотребление, т. е. применение 
термина «математическая лингвистика» для обозна- 
чения части лингвистики, представляется авто- 
рам неудачным. Оно создает ошибочное впечатление, 
будто существуют две разные лингвистики — одна 
принципиально не математическая, другая — осо- 
бая, «математическая». В действительности же линг- 
вистика есть единая наука со своими задачами и 
своим объектом, которая пользуется математиче- 
скими методами там, где они нужны, и не пользуется 
ими там, где они не нужны. 

В настоящей книге под «математической лингви- 
стикой» понимается нечто совсем другое, а именно — 
определенный круг математических, по существу, 
работ, возникших из попыток строго описать факты 
естественных языков и содержащих результаты, 
которые могут оказаться полезными] для лингви- 
стики. При этом к указанному кругу не относятся 
те направления исследований, для которых язык 
является лишь одним из возможных приложений 
(в частности, работы чисто количественного харак- 
тера, т. е. лингвистическая статистика и т. д.): для 
математической лингвистики в данном понимании 
характерно использование лишь тех математических 
методов, которые в определенном смысле (см. ниже) 
специфичны для языка как такового. Итак, мате- 
матическая лингвистика есть ма- 
тематическая дисциплина, «обра- 
щенная» в сторону естественных 
языков и лингвистики. 

Задача настоящей книги состоит в том, чтобы по- 
пытаться охарактеризовать объект и методы матема- 
тической лингвистики, а также ее соотношение с 
лингвистикой, по возможности пользуясь при этом 
привычными для лингвистов представлениями, 
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Язык как отображение (функция) 


Поскольку математическая лингвистика — это, 
как было уже сказано, математическая дисциплина, 
будет удобным начать изложение с рассмотрения 
следующей ситуации: математик, совершенно незна- 
комый с лингвистикой, наблюдает речевое поведение 
людей, т. е. функционирование языка, и пробует 
описать его; естественно, что полученное описание 
будет отражать присущий ему математический образ 
мышления и будет строиться с привлечением хотя бы 
простейших понятий математики. Это описание могло 
бы быть, например, таким. С одной стороны, наш ма- 
тематик видит, что содержанием речевой деятельно- 
сти является передача различных желаний, чувств, 
представлений, мыслей и т. п. Все это он для крат- 
кости называет «планом содержания» (не пытаясь 
дать определение этому термину). С другой стороны, 
он видит, что средством передачи, или выражения, со- 
держания служат последовательности физических сиг- 
налов (звуковых илиграфических), которыеон называ- 
ет «планом выражения». Для математика естественно 
представлять себе и план содержания, и план выра- 
жения как совокупности, или — пользуясь матема- 
тической терминологией — множества некоторых эле- 
ментов, которые он называет, допустим, соответ- 
ственно «смыслами» и «текстами». Смыслы и тексты 
вовсе не обязаны быть простыми единицами: так, 
наблюдаемым текстом может быть слово, предложе- 
ние, очень длинное высказывание и т. д., вплоть 
до целой книги (аналогично обстоит дело со смысла- 
ми). Далее, наш математик замечает, что между 
смыслами и текстами имеется соответствие: каждому 
смыслу отвечает более или менее определенная 
совокупность (множество) текстов, а каждому тек- 
сту — более или менее определенное множество 
смыслов. Правила, определяющие, какие тексты 
соответствуют каким смыслам, и образуют по суще- 
ству то, что в обиходе принято называть языком. 
Математик ке усмотрит в этой системе правил (т. е. 
в Языке!) частный случай важнейшего понятия своей 
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науки — отображения, или функции. 
Эта функция сопоставляет каждому смыслу некото- 
рое (конечное) множество текстов, а именно, множе- 
ство синонимичных текстов, несущих этот смысл 
(вообще говоря, один текст может соответствовать 
разным смыслам — омонимия). При этом наш мате- 
матик заметит, что данная функция является, по- 
видимому, эффективно вычислимой (короче — эффек- 
тивной) *); действительно, язык представляет собой 
некоторый регулярный способ эффективного полу- 
чения текстов по заданным смыслам и обратно. Этот 
способ пока не известен математику-наблюдателю, 
но изучение речевого поведения людей приводит его 
к гипотезе, что такой способ, как-то «записанный» 
в мозгу носителей языка, безусловно имеется. При 
этом он знает, что изучением свойств эффективных 
функций занимается специальная математическая 
дисциплина — теория алгоритмов, являющаяся в 
свою очередь ответвлением математической логики. 
Если теперь наш математик захочет исследовать 
язык, то для него это будет означать исследование 
соответствующей функции. Он будет стремиться 
построить ее в явном виде как некоторую систему 
правил и одновременно начнет описывать ее свойства. 
Естественно, что он попытается обратиться к теории 
алгоритмов, как к источнику сведений относительно 
функций такого типа и методов их изучения. 
Однако естественные языки образуют очень спе- 
цифический, имеющий свои особые характеристики 
класс эффективных функций. И наш математик сразу 
же обнаружит, что сведений об эффективных функ- 
циях, почерпнутых из теории алгоритмов, для иссле- 
дования естественных языков недостаточно. Следова- 
тельно, ему придется специально заняться изучением 
именно этих особых эффективных функций, тем са- 
мым развивая теорию алгоритмов в некотором новом, 


*) Функцию 1 (5) принято называть эффективно зычис- 
лимой, если для нее указан вполне определенный способ, по- 
зволяющий для любого значения х найти за конечное число 
шагов значение Г (5), Т. е. если, грубо говоря, она может 
быть вычислена на машине. 
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нужном ему направлении. При этом он может столк- 
нуться с необходимостью исследовать также и такие 
свойства интересующей его функции, которые не 
связаны с ее эффективностью (и поэтому, вообще 
говоря, не изучаются теорией алгоритмов) и носят 
очень общий абстрактный характер. Подобные свой- 
ства, т. е. свойства отображений, соверттенно не за- 
висящие от их конкретной природы (например, ассо- 
циативность, коммутативность и т. п.), являются 
предметом алгебры. Стало быть, математик-лингвист 
должен будет воспользоваться еще и алгебраически- 
ми фактами и методами. 

Приблизительно так и действовали, по всей веро- 
ятности, реальные математики, приступившие к си- 
стематическому исследованию естественного языка 
в 50-х годах (что стимулировалось, в частности, 
появлением ряда прикладных задач: автоматическая 
обработка языковой информации и т. д.). В резуль- 
тате их усилий сложилась специфическая математи- 
ческая дисциплина со своей особой тематикой, иссле- 
дования по которой ведутся в целом ряде стран и по 
которой публикуется большое количество работ. 
Эту дисциплину и предлагается называть математи- 
ческой лингвистикой. 

Таким образом, математическая лингвистика — 
это область, которую можно рассматривать, с одной 
стороны, как специальную ветвь теории алгоритмов, 
а с другой стороны — как частный раздел алгебры, 
в связи с чем эту область иногда называют алгебраи- 
ческой лингвистикой. В некоторых работах по 
математической лингвистике преобладающую роль 
играет теория алгоритмов, в других — алгебра, 
а в третьих тесно переплетаются методы обеих дисцип- 
лин. Кроме того, нередко приходится пользоваться 
комбинаторными методами. Объектом же математиче- 
ской лингвистики являются функции (отображения) 
особого рода и различные возникающие в связи с 
цими абстрактные образования, в ряде существенных 
отношений сходные с естественными языками. 

Необходимо подчеркнуть, что, как следует из 
сказанного, математическая лингвистика представ- 
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ляет собой в основном неколичествен- 
ную дисциплину. Здесь, по-видимому, не- 
обходимо специальное разъяснение. В ряде наук 
основным методом описания свойств изучаемых объ- 
ектов является установление соотношений между 
характеризующими эти объекты величинами. На- 
пример, в физике основные результаты — это коли- 
чественные формулы; экспериментальная проверка 
физических утверждений сводится, как правило, 
к ряду измерений. Разумеется, количественные ут- 
верждения физически отражают глубокие качествен- 
ные особенности физического мира; однако именно 
количественные соотношения являются основной 
формой описания этих особенностей. 

Совсем иначе обстоит дело в лингвистике. Суще- 
ственные характеристики языка не имеют количе- 
ственной природы, т. е. не являются величинами; 
лингвистический эксперимент обычно не связан с из- 
мерениями. Старый тезис «Язык внеположен числу» 
имеет, при всей его расплывчатости, глубокое ра- 
циональное содержание. Вовсе не случайно, что ос- 
новные достижения лингвистики, полученные за 
все время ее существования, не формулируются 
в виде количественных утверждений; вообще, прин- 
ципиальная «неколичественность» типична для по- 
давляющего большинства лингвистических работ. 
Такое положение связано, на наш взгляд, с природой 
самого объекта лингвистики — со свойствами есте- 
ственного языка-—и представляется поэтому вполне 
закономерным. Однако детальное обоснование выска- 
занных соображений должно быть темой отдельного 
исследования *). 

Положению о неколичественном характере мате- 
матической лингвистики вовсе не противоречит тот 


*) Вообще говоря, количественные утверждения о языке 
возможны (чаще всего эти утверждения относятся к распре- 
делению тех или иных величин, вроде длины фраз или слов, 
частоты слов того или иного типа и т. п.; ср., например, из- 
вестный закон Ципфа). Мы, однако, полагаем, что в описа- 
нии языка такие утверждения всегда носят исриферийный 
характер. 
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факт, что в ней (равно как и в «обычной» лингвисти- 
ке) в ряде случаев оказываются необходимыми те 
или иные вычисления: ср. использование выкла- 
док для доказательства существования алгоритма 
(стр. 52—53), оценки сложности выводов в грамма- 
тиках (стр. 116—119), алгоритм классификации букв 
(стр. 171—173). Подобные обращения к количеству, 
сколь бы существенными они ни были, всегда играют 
подчиненную, вспомогательную роль — в том смысле, 
что их конечной целью является получение чисто ка- 
чественных результатов, не представимых в виде 
количественных зависимостей. Так, хотя только что 
упомянутый алгоритм классификации букв основан 
на вычислениях, в результате его работы получается 
разделение букв на гласные и согласные, что само по 
себе с количеством никак не связано. Оценки сложно- 
сти алгоритмов и выводов, которые имеют в матема- 
тической лингвистике немалое значение (и, вероятно, 
в дальнейшем будут иметь значение еще более 
важное), нужны только для суждений об адек- 
ватности/неадекватности тех или иных моделей, 
т. е. опять-таки для сугубо неколичественных утвер- 
ждений. 

Существенная особенность вычислений, приме- 
няемых при изучении и описании естественных язы- 
ков, состоит, по мнению авторов, в том, что такие 
вычисления во многих случаях должны относиться 
скорее не к речи, а к самому языку, т. е. к системе. 
Другими словами, наиболее плодотворными пред- 
ставляются не подсчеты типа «Сколько раз встреча- 
ется в данных текстах данное слово, данная конструк- 
ция, слова данного класса ит. п.»: определение числа 
каких-либо объектов в большинстве интересных слу- 
чаев выполняется не экспериментально (т. е. не пря- 
мым пересчетом этих объектов, например, в реальном 
тексте), а чисто дедуктивно (рассуждениями, исхо- 
дящими из их абстрактных свойств). 

Математичестая лингвистика является неколи- 
чественной дисциплиной в той же степени, в какой 
призпаются неколичественными современная алгебра 
или теория алгоритмов. 3 этих областях также 
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нередко привлекаются количественные соображения, 
которые тем не менее остаются в них на втором 
плане. 

Мы остановились на вопросе о неколичественном 
характере математической лингвистики столь под- 
робно только потому, что среди филологов существует 
убеждение о тождестве математической лингвисти- 
ки со статистикой речи *). Несмотря на его распро- 
страненность, подобный взгляд фактически глубоко 
ошибочен и методически вреден. 


‚ #*) В недавно вышедшем стабильном учебнике для вузов 
(Реформатский А. А., Введение в языковедение, М., 
1967) читаем: ‹...Математическая лингвистика... является не 
особой лингвистикой, а лишь применепием к языковым яв- 
лениям математических методов. Главным образом, это отно- 
сится к речи, а не к языку, папример применение теории ве- 
роятностей и математической статистики» (стр. 50). 
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Чтобы дать читателю более конкретное представ- 
ление о математической лингвистике, мы остановимся! 
на одном из ее разделов, который в настоящее время: 
оказался наиболее разработанным, а именно, на. 
так называемой теории грамматик. Под грам-- 
матиками в математической лингвистике пони-. 
маются некоторые специальные системы правил. 
задающие (или характеризующие) множества цепо-. 
чек (конечных последовательностей) символов. Эти 
цепочки могут интерпретироваться как. языковые: 
объекты различных уровней, например как слово- 
формы (цепочки морф *)), словосочетания и предло- 
жения (цепочки словоформ) и т. п. 

Таким образом, грамматики математической линг-- 
вистики — формальные грамматики — 
имеют дело.с абстракциями, возникающими путем’ 
обобщения таких обычных лингвистических понятий, 
как словоформа, словосочетание, предложение. 

Поясним, что имеется в виду, когда говорится 
«формальные грамматики задают множества цепочек». 
Из данного набора символов (обозначающих, напри- 
мер, все словоформы русского языка) можно строить 
какие угодно цепочки; некоторые из этих цепочек 
естественно считать правильными, или допустимыми 
(например, грамматически правильные предложе- 
ния — Сосны шумят на ветру или Радости, свистят 
на меху), а другие — неправильными, или недопу- 


*) Смысл понятия «морфа» можно приблизительно разъяс- 
нить для нелингвиста следующим образом: морфы — это ми- 
нимальные осмыслеппые (или имеющие самостоятельную фун- 
кцию) части словоформ, например пере - доказ -- ыва -- 
+ ем + ому (плюс обозначает границы между морфами). 
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стимыми (*Бетру на шумят меху; звездочкой отме- 
чаются неправильные фразы, словоформы и т. п.). 
Формальная грамматика задает (характеризует) пра- 
вильные цепочки, если имеет место одно из двух: 

1) либо для любой предъявленной цепочки грам- 
матика умеет решить, является эта цепочка правиль- 
ной или нет, и в случае положительного ответа дать 
указания о строении этой цепочки; 

2) либо грамматика умеет построить любую пра- 
вильную цепочку, давая при этом указания о ее стро- 
ении, и не строит ни одной неправильной цепочки. 

В первом случае формальная грамматика называ- 
ется распознающей, во втором — порож- 
дающей *). | 

Выше указывалось, что с математической точки 
зрения язык представляет собой некоторую эффек- 
тивную функцию. Эта функция имеет чрезвычайно 
сложное строение, и поэтому ее целесообразно изу- 
чать по частям — выделяя более простые функции, 
содержательно соответствующие разным уровням 
естественного языка, например, функции, преобра- 
зующие смысл в синтаксическую структуру **); функ- 
ции, преобразующие синтаксическую структуру вли- 
нейную последовательность слов; функции, преобра- 
зующие структурную характеристику словоформ в ре- 
альную словоформу, ит. п.***). Формальные грамма- 


*) Ср., впрочем, замечания на стр. 150 и сл. 

**) Здесь и ниже имеются в виду «заполненные» структуры, 
например, синтаксические деревья, в узлах которых помеще- 
ны конкретные лексемы. 

***) Как можно вядеть из предшествующего изложения, 
авторы полагают, что более адекватной моделью языка был 
бы не механизм, производящий (перечисляющий) его пра- 
вильные фразы, а устройство, преобразующее любой задан- 
ный смысл в соответствующие тексты или, наоборот, извле- 
кающее смысл из лтобого заданного текста (ср. Жолковский— 
Мельчук 1967). Таким образом, наш подход отличается от 
концепции Н. Хомского. Было бы весьма интересно разоб- 
раться в данном отличии по существу; однако мы этого делать 
не будем, поскольку соответствующая проблема выходит за 
рамки задач этой книги, а способ ее решения практически не 
сказывается па изложении нашего основного материала, в 
частности теории формальных грамматик. 


О понятии формальной грамматики 25 


тики — это некоторый способ изучать и описывать по- 
добные функции-компоненты. А именно, грамматики 
позволяют задаватьмножества значений этих функций. 
В отличие от самой фупкции, которая от любого ука- 
занного значения аргумента позволяет перейти к 
вполне определенному результату, существующие 
формальные грамматики описывают только совокуп- 
ность возможных результатов, не давая прямых 
указаний, как именно можно получить результат, 
соответствующий определенному исходному «за- 
просу». 

Эту особенность рассматриваемые в книге фор- 
мальные грамматики разделяют с обычными грамма- 
тиками (т. е. с грамматиками в общеупотребительном 
смысле слова). 

Однако между обычными и формальными грамма- 
тиками имеется существенное различие. В формаль- 
ных грамматиках все утверждения формулируются 
исключительно в терминах небольшого числа четко 
определенных и весьма элементарных «вещей» (сим- 
волов и операций). Это делает формальные граммати- 
ки очень простыми с точки зрения их логического 
строения *) и облегчает изучение их свойств дедук- 
тивными методами. Однако эта же самая особенность 
приводит к тому, что формальные грамматики ока- 
зываются весьма громоздкими: если мы хотим, чтобы 
разных типов исходных деталей было как можно 
меньше, а сами эти детали были как можно проще, 
то для описания достаточно сложных явлений есте- 
ственного языка таких деталей, точнее, экземпляров 
таких деталей, требуется очень много. Поэтому 
формальные грамматики не способствуют повышению 
обозримости лингвистических описаний и неудобны 
для непосредственного использования человеком 


*) Слово «простой» не следует понимать здесь в обиход- 
ном смысле как «наглядный», «легко обозримый» и т. п. Име- 
ется в виду простота (= несоставность, элементарность) компо- 
нентов и простота (== единообразность) способа соединения 
компонентов в целое—так сказать, локальная простота. Само 
же целое может быть очень большим по объему и весьма 
сложным по строению, а потому плохо обозримым, т. е. вовсе 
не простым в буквальном смысле этого слова. 
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(например, учить иностранный язык с помощью его 
формальной грамматики вряд ли целесообразно). 
Формальные грамматики предназначаются сугубо 
для научного, теоретического исследования наиболее 
общих свойств языка. Впрочем, не исключается и их 
практическое использование, особенно в связи с при- 
менением вычислительных машин, например, при 
автоматическом переводе. 

Мы не будем излагать теорию грамматик в полном 
объеме, а ограничимся основными сведениями о по- 
рождающих грамматиках ($$ 2—5); кроме того, 
в $ 6 кратко характеризуются некоторые понятия, 
относящиеся к другим разделам теории грамматик 
(категориальные грамматики и автоматы с магазинной 
памятью). 

Со следующего раздела начинается изложение 
конкретного материала — теории порождающих 
грамматик. 


Предварительный пример: правила 
0об разования русских причастий 


Допустим, что нас интересует совокупность всех 
форм причастий в письменной разновидности рус- 
ского языка и мы хотим как-то задать эту совокуп- 
ность, например, выписав систему правил, с помощью 
которых можно было бы получать любые правильные 
формы причастий, не получив при этом ни одной не- 
правильной. (Подчеркнем, что данная задача явля- 
ется частным случаем общей задачи, стоящей перед 
формальными грамматиками: их цель состоит в за- 
дании совокупностей цепочек.) 

Ниже приводится образец подобных правил, но 
не для всех русских глаголов, а только для несколь- 
ких, выбранных довольно случайным образом; при 
этом ради простоты примера правила составлены 
так, как если бы глаголов других тинов и с другими 
особенностями не было вовсе. Тем самым наш пример 
не претендует на какую-либо значимость для описа- 
ния русского языка и носит чисто иллюстративный 


характер. 
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Мы будем представлять себе словоформу-прича- 
стие как цепочку морф, включающую от трех до 
пяти морф: вед -- ш -- ий, раздел’ - а + уущ -Ё ий, 
раздел” а -- ущ -{ ий - ся *). 

Словоформы и морфы записываются в основном 
в принятой орфографии с небольшой примесью 
транскрипции — там, где это удобно для формули- 
ровки правил: в ряде случаев особо обозначается 
мягкость согласных (только парных мягких!) и ис- 
пользуется }. 

Различается шесть классов морф: 

1) основы — раздел’-, стро]-, потер”-, люб’- и т. д. 

2) «тематический элемент» («расширитель осно- 
вы») — -и-/-а-/-ова-/-у-; 

3) имперфективирующий суффикс (суффикс, слу- 
жащий для образования форм несовершенного ви- 
да) — -ива-/-ыва-/-а-; 


4) суффиксы причастий — -ащ/-/-ущ-, -вщ-]-ш- и 
т. д.; 

5) окончания (флексии) причастий — -ая, -ую, 
-ий/-ый и т. д. 

6) возвратная частица — -ся. 


В правилах, по которым морфы соединяются друг 
с другом, существенным образом используются оп- 
ределенные признаки ряда морф **), а именно: 


*) В рамках данного примера корень с префиксом рассмат- 
риваются вместе как одна морфа («основа»). Апостроф обозна- 
чает мягкость согласных, т. е. л’а = ля, н’о == нё ит. п. 

**) Пояснения к обозначениям значений признаков морф: 
«сов-несов» означает, что данный глагол омонимичен в отно- 
шении вида (автоматизировать, исследовать); 

«а» означает необходимость тематического элемента -а- 
(опозд -- а-), «ова» — необходимость тематического элемента 
-ова-|-у-(исслед -- ова-, исслед + у-- ют); «А» означает, что 
тематический элемент -а- возможен, но не необходим (стон -- 
| а-- вш-| ий, но стон - ущ - ий), «т» — что тематичес- 
кий элемент -и- возможен, но не необходим (крас | и + вш -+ 
-- ий, но крас -- ящ -+ ий); «атем» означает невозможность 
тематического элемента (вед -- ш - ий); 

«ЫВА» означает возможность присоединения имперфек- 
тивирующего суффикса -ыва-/-ива- (опаздывать), «А» — им- 
перфективирующего суффикса -а- (ср. решить — решать), 
«2» — невозможность имперфективирующего суффикса (по- 
строить); 
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ПО 

Для основ: 1) переходность/непереход- 
ность (1/7); 2) вид (сов/несов/сов-несов); 3) спряжение 
(Т/ТТ); 4) возможность или необходимость тематиче- 
ского элемента (а/ова/а/Й/атем); 5) возможность 
присоединения —имперфективирующего суффикса 
(ЫВА/А/$); 6) возможность или необходимость 
присоединения -ся (ся/ся/ся-ся). 

Для суффиксов причастий: 1) спря- 
жение (1/П/-11); 2) залог (активное/пассивное = 
= акт/пасс); 3) время (настоящее/прошедшее == наст/ 
пром). 

Для флексий причастий — форма 
(полная/краткая = пф/ку). 

Ниже приводятся перечни морф всех названных 
классов с указанием нужных признаков. 


Класс 1. Основы 
автоматизир-(Е, сов-несов, Г, ова, ф, ся-ся) 
вед-(+, несов, Т, атем, $, ся-ся). 
исслед- (Ё, сов-несов, Г, ова, $, ся-ся) 
крас’-(1, несов, 1, и,ф, ся-ся) 
люб?- (&, несов, 11, и, ф, ся-ся) 
нес-(#, несов, 1, атем, ф, ся-ся) 
опозд-(1, сов, Га, ЫВА, ся) 
покрас’-(Е, сов, П, и, ф, ся-ся) 
пост ро]-(ь, сов, 1, и, $, ся-ся) 
потер’-(Ё, сов, Г, а, $, ся-ся) 
привед-(+, сов, Г, атем, $, ся) 
принес-(, сов, Т, атем, ф, ся) 
раздел”-(&, сов, 1, и,А, ся-ся) 
сме]-(, несов, Т, а, $, ся) 


«ся» означает необходимость присоединения -ся (смеять- 
ся), «ся» — невозможность присоединения -ся (стонать), 
«ся-ся» — возможность форм как с -ся, так и без -ся.(терять— 
теряться); | 

«1-1» означает, что данный суффикс может присоеди- 
няться к основам как ТГ, так и П спряжения (терявший — 
красивший). 
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спрос’-(+, сов, П, и,ЫВА,ся-ся) 
стон-(1, несов, Т,а, $, ся) 
стро]-(!, несов, 1, и, ф, ся-ся) 
тер’-(Ё, несов, Т, а, Ф, ся-ся) 


Класс 2. Тематические элементы 
-а- -ова- 
-и- -у- 
Класс 3. Имперфективирующие 
суффиксы 
-п,- 


-ыва- 


Иласс 4. Суффиксы причастий 


-ащ-(П, акт, наст) -им-(ЦП, пасс, наст) 
-ущ{-(Т, акт, наст) -0м-(Т, пасс, наст) 
-в1и-(Т-П, акт, прош) -нн-(Т, пасс, прош) 
-ш- (1-П, акт, прош) -онн-(П, пасе, прош) 


Класс о. Флексии причастий 


-ая -ую \ -А 

-0г0 -ые -а 

-0е -ый (иф) -0 (кф) 

-0й -ым -ы 

-0. и | (Л—«нулевое окончание», 
-0му -ых ] как в потерян) 


Класс 6. Возвратная частица 
-ся 


Теперь мы приведем правила, в соответствии с ко- 
торыми из перечисленных морф строятся формы 
русских причастий. 


30 $ 2. Формальные грамматики 
Т. Правила общего строения 


1. В словоформу должно входить не более чем 
по одной морфе из каждого класса. 

2. Морфы должны следовать друг за другом в по- 
рядке нумерации классов. 

3. Морфы классов 1, 4, 5 (основа -- суффикс 
причастия -- флексия) должны присутствовать обя- 
зательно. 


П. Правила несовместимости 


Словоформа не может содержать одновременно: 

1. Морфы классов 2 и 3 (тематический элемент 
и имперфективирующий суффикс) *). 

2. Основу с признаком «? и суффикс причастия 
с признаком «пасс» (от непереходных глаголов невоз- 
можны страдательные причастия). 

3. Основу с признаком «ся» и частицу -ся. 

4. Основу с признаком «сов» при отсутствии импер- 
фективирующего суффиксаи суффикс причастия с при- 
знаком «наст» (от глаголов сов. вида невозможны 
причастия наст. времени). 

5. Основу с признаком «ф» и имперфективирую- 
щий суффикс. 

6. Основу с признаком «Т» и без признака «атем» 
и суффикс причастия с признаком «Ш» (тематические 
глаголы [1 спряжения не допускают суффиксов П 
спряжения). 

7. Основу с признаком «атем» и суффикс причастия 
с признаком «П», отличный от -онн- (атематические 
глаголы не допускают суффиксов П спряжения, за 
исключением -онн-). 

8. Имперфективирующий суффикс и суффикс 
причастия с признаком «ПП» (имперфективирующий 
суффикс переводит любой глагол в первое спря- 
жение). 


*) В целях упрощения примера данное правило не учи- 
тывает многочисленных форм типа арестовывавикий, выковы- 
вающий, организовывавший и т. п. 
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9. Основу с признаком «[Ш› при отсутствии импер- 

фективирующего суффикса и суффикс причастия 
-с признаком [. 

10. Суффикс причастия с признаком «акт» и флек- 
сию с признаком «кф» (действительные причастия 
не имеют краткой формы *)). 

11. Основу с признаком «атем» (соответственно 
без признака «атем») и суффикс -ви- (соответственно 
-ш-); ср. ведщший, но опоздавший. 

12. Основу с признаком «Й» или «8», тематический 
элемент и суффикс причастия, начинающийся на 
гласный (если при данной основе тематический 
элемент не обязателен, то перед суффиксом прича- 
стия, начинающимся на гласный, он не исполь- 
зуется). 

13. Основу с признаком «И» (соответственно с'приз- 
наком «8›) и тематический элемент, отличный от 
-и- (соответственно от -а-). 

14. Имперфективирующий суффикс и суффикс при- 
частия с признаками «пасс», «прош», ср. *спрали-ива- 
нн-ый, *раздел’-а-нн-ый. 

15. Суффикс причастия с признаком «пасс» и 
частицу -ся (страдательные причастия не могут быть 
возвратными). 


ПТ. Правила неотделимости 


Словоформа обязательно должна содержать: 

1. При наличии основы с признаком «а» — либо 
тематический элемент -а-, либо имперфективирующий 
суффикс. 

2. При наличии основы с признаком «ова» — либо 
тематический элемент -ова- (если имеется суффикс 
причастия с признаком «прош»), либо тематический 
элемент -у- (если имеется суффикс причастия с при- 
знаком «наст»). 


*) Известное огрубление: в поэтической речи краткие 
действительные причастия изредка встречаются. Ср., 
например, ... их воздухом воющ тростник и сладок (0. Ман- 
дельштам). 
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3. При наличии основы, не имеющей признака 
«атем», и суффикса причастия с началом на соглас- 
ный — либо тематический элемент, либо имперфек- 
тивирующий суффикс. 

4. При наличии основы с признаком «ся» — ча- 
стицу -ся. 


ТУ. Морфонологические и фонологические *) правила 


1. Между двумя соседними гласными, принадле- 
жащими к разным морфам, появляется ]. Здесь име- 
ются в виду случаи типа раздел’ | а - ущ -{+ -> 
— раздел’ + а + рущ +. 

2. В словоформе, содержащей суффикс -ыва-, кор- 
невой гласный о (последний о в основе) меняется 
на а **). 

3. Перед суффиксами -онн-, -ыва- конечный со- 
гласный основы -с’- заменяется на -\-, а конечный 
согласный -6’- — на -6бл’- (аналогично, д’—ж, 
т’ —ч, в’ + дит. д.; но в нашем списке нет основ 
на -д’-, -т’-, -в’-). 

4. Перед суффиксом -онн- твердые конечные со- 
гласные атематических основ смягчаются: д-> д’, 
сс ит. д.; принес - у[принес’ -- онн -- ый. 

9. Перед флексией с признаком «кф» суффиксы 
-онн- и -нн- преобразуются соответственно в -он- 
и -н-. 

6. Сочетание }и заменяется на и. 


*) Морфонологические правила — это правила, относя- 
щиеся к последовательностям фонем (в нашем случае фонемы 
для простоты отождествляются с буквами), но обязательно 
учитывающие морфологическую роль этих последовательно- 
стей. Фонологические правила имеют дело просто с носледо- 
вательностями фонем, безотносительно к их морфологическому 
статусу. В данной группе правил фонологическим является 
только правило [У.6. 

**) Чтобы описать неучтенные здесь случаи типа основ -- 
-- ать — основ | ывать (чередование о/а невозможно) или 
удосто |- ить — удосто + ивать — удоста -+ ивать (чере- 
дование о/а возможно, но не обязательно), было бы необхо- 
димо ввести еще один признак основ: чередование о/а перед 
-ыва- возможно/невозможно/обязательно. 


П редварительный пример 33 


У. Графическо-орфографические правила 


1. Сочетания ]а, ]у, ]0 изображаются буквами 
я, ю, е*) соответственно. 

2. Сочетания Х’а, Ху, Х’о, Х’и, Х’ы| изобража- 
ются на письме как Хя, Хю, Хе, Хи, Хи соответствен- 
но (Х’— любой парный мягкий согласный). 

3. После букв эж, ч, ш, щ вместо ы, о пишутся и, е. 

Примечание. Особую трудность представ- 
ляет образование страдательных причастий прошед- 
шего времени от основ несов. вида без имперфекти- 
вирующего суффикса. В одних случаях они явно 
возможны — писанный, крашенный, в других, по- 
видимому, явно невозможны — *веденный, *люб- 
ленный; имеется много промежуточных, не вполне 
ясных случаев: терянный? строенный? Как кажется, 
решающее значение здесь имеет узус, который в из- 
ложенных правилах не учитывается, а потому подоб- 
ные образования, формально всегда возможные, 
допускаются этими правилами (и порождаются по- 
строенной на основе этих правил грамматикой, 
стр. 34—43). 

Возможно, читателя удивит большое количество 
и разнообразие правил, оказавшихся необходимыми 
для описания причастий от нескольких русских 
глаголов. Следует признаться, что этот факт удивил 
и самих авторов, которые стремились подобрать при- 
мер, как можно более простой, но вместе с тем пока- 
зательный. Однако с фактами приходится считаться: 
русская морфология заслуженно считается очень 
сложной. В предложенных правилах эта сложность 
гораздо более заметна, чем в «обычных» описаниях, 
по той причине, что здесь все выписано в явной фор- 
ме, тогда как в существующих описательных грамма- 
тиках русского языка этого никогда не делается. 
Впрочем, надо иметь в виду, что нам пришлось вклю- 
чить в число правил и такие, которые совсем не 


*) Этое (равно как иев пп. 2—3) может соответствовать 
как е, так и ё, которые в печатном тексте обычно не различа- 
ются. Выбор между ними определяется ударением: под уда- 
рением е —= ё (принесенный), без ударения е = е (теряемый). 


2 А. Гладкий, И. Мельчук 


34 $2. Формальные грамматики 


являются специфическими для причастий (в частности, 
все графическо-орфографические правила). Поэтому 
— и это особенно существенно — если значительно 
увеличить наш список основ (т. е. привлечь намного 
больше глаголов), то это не потребовало бы сколько- 
нибудь значительного ‘увеличения объема правил. 


Определение и пример порождающей 
грамматии 


Итак, мы построили точные правила, описываю- 
щие нужную нам совокупность словоформ — формы 
причастий нескольких русских глаголов—и тем са- 
мым решили задачу, сформулированную на стр. 26. 
Однако наше описание неудовлетворительно в одном 
важном отношении, а именно: оно само не построено 
по каким-либо определенным правилам, а образую- 
щие его правила не состоят из заранее выделенных 
и фиксированных элементарных компонентов. (Разу- 
меется, такие компоненты можно выделить; однако 
для этого требуется специальное исследование, и мы 
получим совсем другое описание.) Если же мы хотим 
не только описывать конкретные языки, но и рассмат- 
ривать в самом общем виде способы описн- 
вать языки, то необходимо строить все 
наши описания единообразно, составляя их 
из элементарных компонентов, соединяемых по строго 
определенным правилам. Только в этом случае мы 
сможем применять к лингвистическим описаниям 
строгие (математические) рассуждения. 

Формальная грамматика и представляет собой 
такого рода описание. Весь арсенал используемых 
ею средств четко фиксируется в ее определении, а все 
ее утверждения имеют точно определенную форму, 
также фиксируемую определением. 

Как уже было сказано, мы будем рассматривать 
только порождающие формальные грамматики. Пе- 
рейдем к определению соответствующего понятия. 
Одновременно будем строить в качестве иллюстра- 
ции грамматику,Го, порождающую те же формы при- 
частий, что и в разобранном выше примере. 
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Однако предварительно необходимо сделать два 
важных замечания. 

Во-первых, на самом деле мы будем рассматри- 
вать не любые мыслимые порождающие грамматики, 
а определенный класс таковых, введенный Н. Хом- 
ским (Хомский 1962, 1965а). Именно с грамматик 
этого класса началось изучение порождающих грам- 
матик вообще; более того, и сейчас грамматики 
Хомского остаются наиболее исследованными во всех 
аспектах: общая теория формальных порождающих 
грамматик на 90% ‚, если не больше, сводится к теории 
грамматик Хомского. Это позволяет нам вместо пол- 
ного названия «формальные порождающие грамма- 
тики в смысле Хомского» пользоваться термином 
«порождающие грамматики», или даже просто «грам- 

АВ матики» (разумеется, только в тех случаях, когда 
контекст исключает неправильное понимание). 

Во-вторых, в работах по теории порождающих 
грамматик (мы имеем в виду прежде всего работы на 
русском языке, в том числе и переводные) имеет место 
явно нежелательный терминологический разнобой. 
Для ряда понятий употребляется по два-три разных 
термина, причем многие из этих терминов, и часто 
как раз самые употребительные, по своей внутренней 
форме представляются нам неудачными (обычно это 
объясняется слишком буквальным переводом, даже 
калькированием английских терминов). Поэтому мы 
позволим себе в отдельных случаях пользоваться 
малоупотребительными терминами, не приводя, од- 
нако, в тексте тех соображений, которые заставили 
нас предпочесть тот или иной термин: такие сообра- 
жения, а также параллельные термины на русском 
и английском языках приведены в комментированном 
словарике терминов (см. Приложение []). 

Порождающая грамматика — это система, со- 
стоящая из четырех частей: основной, или терминаль- 
ный, словарь; вспомогательный словарь; начальный 
символ; набор правил подстановки. 

1. Основной (терминальный) словарь — набор 
исходных элементов, из которых строятся цепочки, 
порождаемые грамматикой. 


2* 
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В грамматике Г, — это набор всех русских букв, 
которые набираются курсивом в отличие от прочих 
употреблений этих букв (в тексте книги, в качестве 
фонетической транскрипции, для обозначения инфор- 
маций к вспомогательным символам и т. д.). Таким 
образом, реальные русские морфы и словоформы 
будут записываться курсивом. 

Элементы основного словаря называют основ- 
ными (терминальными) символами. 

Морфы как таковые не считаются самостоятель- 
ными символами и поэтому не входят ни в основной, 
ни во вспомогательный (см. ниже, п. 2) словарь: 
они рассматриваются как цепочки терминальных 
символов — букв. Роль словаря основ (ср. 1-й класс 
морф в только что разобранном примере, стр. 28—29), 
здесь по существу играют правила груплы УШ 
(см. ниже, стр. 41). 

Замечание. С лингвистической точки зре- 
ния было бы правильнее (и естественнее) описывать 
формы русских причастий с помощью двух раз- 
ных грамматик: одна из них представляла бы при- 
частие в виде последовательности символов морф, 
а вторая перерабатывала бы эти последовательности 
в реальные буквенные цепочки, т. е. строила бы 
формы русских причастий в правильной орфографиче- 
ской записи. Тем самым разные уровни языка опи- 
сывались бы разными грамматиками. (Вторая грам- 
матика, по сути дела, не вполне удовлетворяла бы 
определению порождающей грамматики *), хотя 
формально ее можно было бы сделать таковой.) 
Тогда основной словарь первой грамматики состоял 
бы из символов морф (перечень основ и аффиксов), 
а вспомогательный содержал бы только символы 
категорий. Вторая грамматика имела бы в основном 
словаре русские буквы, а во вспомогательном слова- 
ре — символы морф, транскрипционные знаки, гра- 
ничный символ и, возможно, категории букв (глас- 
ные/согласные и т. п.). Подчеркнем, что вторая грам- 

*) А именно, она порождала бы «выходные» цепочки, ис- 


ходя не из единственного начального символа (см. стр. .38, 
п. 3), а из «выходных» цепочек первой грамматики. 
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матика ни по строению, ни по назначению не связана 
специально с порождением причастий: она представ- 
ляет морфологический, фонологический и графиче- 
ско-орфографический уровни языка и необходима для 
порождения любых словоформ (ср. замечание в конце 
предыдущего раздела, стр. 33—34). При таком разбие- 
нии основные и вспомогательные словари обеих 
грамматик выглядели бы более естественно. Мы, 
однако, предпочли — ради единства примера — стро- 
ить одну грамматику. | 

2. Вспомогательный (нетерминальный) словарь — 
набор символов, которыми обозначаются классы 
исходных элементов или цепочек исходных элемен- 
тов, а также, в отдельных случаях, некоторые спе- 
циальные элементы. Эти символы называются вспо- 
могательными, или нетерминальными. 
В грамматике Г, мы введем следующие нетерми- 
нальные символы: 

ПРИЧ — причастие; 

ПРИЧ (5, у, 2) — причастие заданного залога, 
времени и возвратности (значения для х, у, 2 указаны 
ниже, правило Г[); 

О’(а1, а., аз, а4, аъ, ав, а1) — основа причастия, 
включая имперфективирующий суффикс или тема- 
тический элемент, если таковые есть, и вспомога- 
тельная информация к ней: а, — переходность (#1); 
а. — вид (сов/несов); аз — епряжение (Т/Т); а4 — 
тематичность (а/ова/&/Я/атем); а; — возможность им- 
перфективирующего суффикса (ЫВА/А/$); аз — воз- 
можность возвратной формы (ся/ся) *); а7 — возмож- 
ность невозвратной формы (` |ся/` ся); | 

О (41, а5, аъ, а4, аз, ав, ал) — «чистая» основа при- 
частия (без тематического элемента и без имперфек- 


*) Здесь «ся» означает возможность возвратной формы, 
«ся» — невозможность возвратной формы, «] ся» — возмож- 
ность невозвратной формы, «| ся» — невозможность невоз- 
вратной формы. Обратим внимание на то, что обозначения 
«ся» и «ся» имеют теперь пе тот смысл, что на стр. 28—32: там 
возвратность и невозвратность описывались одним признаком, 
принимающим три значения, а здесь — двумя бинарными 
признаками 4 и ат, что позволяет сократить число правил. 
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тивирующего суффикса) с той же вспомогательной 
информацией, что и выше; 

С (5, у, аз)/— суффикс причастия с информацией 
к нему (х — залог, у — время, а. — спряжение, 
см. выше); 

Ф (и) — флексия причастия с информацией к ней; 
и — форма (краткая/полная — кф/пф); 

О, С, Ф — названные морфы без информаций; 

И — имперфективирующий суффикс; 

'Т — тематический элемент; 

-- — граница между морфами; автоматически 
появляется после тех морф, которыми не могут окан- 
чиваться словоформы; 

Х' — мягкая согласная; здесь Х — обозначение 
произвольной согласной; 

] — обозначение звука []] (йот). 

3. Начальный символ — выделенный нетерми- 
нальный символ, обозначающий совокупность (класс) 
всех тех языковых объектов, для описания которых 
предназначается данная грамматика. В грамматике 
Г, — это символ «ПРИЧ», так как наша цель — 
описать совокупность причастий. (В грамматике, 
порождающей предложения, начальным будет сим- 
вол, означающий «предложение»; в грамматике, 
порождающей допустимые слоги, начальный символ 
означает «слог» и т. д.) 

4. Правила подстановки — выражения вида 
«Х —> У», что означает «заменить Х на У» или «под- 
ставить У вместо Х», где Х и У — цепочки, содержа- 
щие любые терминальные или нетерминальные 
символы. В грамматике Г, правила подстановки 
таковы: 

Г. Задание грамматических зна- 
чений порождаемого причастия *). 


*) Для лучшей обозримости правила подстановки разби- 
ты на группы (нумеруемые римскими цифрами), каждая из 
которых отвечает определенной содержательной задаче; эта 
задача указывается при номере группы. Номера групп и 
правил не следует понимать как указания о порядке их при- 
менения: порядок применения правил порождающей грам- 
матики произволен, см. стр. 46. 
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ПРИЧ -+ ПРИЧ (5х, ‚2. 

Здесь х = акт, пасс; 

у = наст, прош; 

д = возвр, невозвр. 

При х = пасс необходимо, чтобы д = невозвр. 


Запись «ПРИЧ — ПРИЧ (5, у, 2)» применяется 
для сокращения: на самом деле здесь написано не 
одно, а шесть правил, соответствующих допустимым 
наборам значений переменных 2, У, 2, например 
«ПРИЧ - ПРИЧ (акт, наст, возвр)», «ПРИЧ -> 
ПРИЧ (пасс, наст, невозвр)» и т. д. Во всех остальных 
случаях переменные х, у, 2 используются таким же 
образом. 

П. Реализация грамматических 
значений соответствующими мор- 
фами. 

1. ПРИЧ (акт, наст, возвр) -> 
— О’ (несов, аз, ся) С (акт, наст, аз) Фся*) 
2. ПРИЧ (акт, прош, возвр) -> 
— О’ (аз, ся) С (акт, прош, аз) Фея 
3. ПРИЧ (акт, наст, невозвр) —> 
— О’ (несов, аз, |ся) С (акт, наст, аз) Ф 
4. ПРИЧ (акт, прош, невозвр)-> 
— 0’ (аз, |ся)С (акт, прош, аз) Ф 
5. ПРИЧ (пасс, наст, невозвр)-> 
— О’ (Ь несов, аз, |ся)С (пасс, наст, аз) Ф 
6. ПРИЧ (пасс, прош, невозвр) > 
—> О’ (Баз, |ся) С (пасс, прош, аз) Ф 

При записи информации к морфам для краткости 
опускаются обозначения тех признаков, которые 
в данном правиле могут принимать любые значения. 
Таким образом, например, запись «О(несов, ся)» 
есть сокращение для многих выражений вида «О (а, 
несов, аз, ад, аъ, ся, @з), где ат, @з, @4, а, аз принимают 
любые допустимые значения; соответственно запись 
«С (акт, наст)» — также сокращение для двух выра- 
жений вида «С (акт, наст, а,)». Поэтому, например, 


_*) Как указывалось выше, курсивом набиралотся реаль- 
ные русские морфы и словоформы. 
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строка 1.1 фактически содержит в себе не одно 
правило, а 120 разных правил. 

Ш. Разложение «ложно основы 
(выделение собственно основы и тематического 
элемента или имперфективирующего суффикса, если 
таковые возможны). 

1. О’(не атем) —> О (не атем) Т*) 

2. О’(несов, не $) С (х, у) — О (сов, не $) ИС (х, у, Г) 
В этом правиле переменные 5 и у должны удовлетво- 
рять следующему условию: при х = пасс необходимо, 
чтобы у = наст. 

3. О’(атем) —> О(атем) 

ТУ. Реализация тематического 
элемента соответствующей мор- 
фой. 

. О (А) Та>О (&) « 
. О (й) Та 0 (й) « 
. О (а) ТО (а)а + 
О (ова)ТС (наст) — О (ова)у -- С (наст) 
О (ова) ТС (прош) — О (ова) ова -- С (прош) 
О (&, ПТВ —- О (а, Г]а - В 
О (я, 11) ТВ О(а, Ши В 
Здесь а и В — сокращения: а — произвольная глас- 
ная, В — произвольная согласная. 


пряковы 


. Реализация имперфективи- 
рующего суффикса соответствую- 
щей морфой. 


1. О (А) ИО (А) а 

2. О (ЫВА)И -+ О (ЫВА) ыва - 

УГ. Реализация суффикса п 
стия соответствующей морф 

1. С (акт, наст, Г) > ущ - 

2. С (акт, наст, П) > ащ + 

3. С (пасс, наст, Г) > ом -- 
4. С (пасс, наст, П) -> им 
5 
6 


рич 
ой. 


. О (неатем) ХС (акт, прош) —> О (не атем) Хвш - 
. О(атем) С(акт, прош) —> О (атемуш - 


*) Здесь «не атем» употребляется для сокращения и озна- 
чает любое значение признака а, отличное от «атем», т. е. 
4 = [72 
«а», «ова», «&» или «иу. Аналогичный смысл имеет запись 
«не 5». 


ь 
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7. О(не атем) ХС(пасс, прош, Г) = 
—О(не атем) Хнн -- 

8. О (атем) С (пасс, прош) > О (атем) онн + 

9. С (пасс, прош; П) > онн - 

Здесь Х — сокращение: любой имперфективирую- 
щий суффикс или тематический элемент, например 
у-, ыва +. 

УП. Выбор формы причастия 
(краткой или полной) и реализа- 
ция флексии соответствующей 
морфой. 

1. Ф-Ф (пф) 

2. С (пасс)Ф — С (пасс)Ф (кф) 

`3—15. Ф (пф) + ый, ое, ого, ому, им, ом, ая, 
ой, ую, ые, ых, им, ыми 

16—19. Ф (кф) — Л, о, а, ы 

Здесь ЛА — пустая цепочка, т. е. цепочка, не со- 
держащая никаких символов. Правило Ф(кф) > А 
содержательно ` означает «можно зачеркнуть символ 
Ф(кф)». 

У, Реализация основы соответ- 
ствующей морфой *). 

О (& несов, Г, атем, $, ся, `]ся) вед |, нес -, ... 

О ($ несов, Т, ова, ф, ся, |ся) —> исслед --, авто- 
матизир --, 

О (Ь несов, Г, а, $, ся, |ся) — тер’ -|, ... 

О (& сов, Т, атем, ф, ся, |ся) — привед--, принес-|,... 

О (Ё, сов, Г, ова, Фф, ся, ]|ся) —> исслед |+, авто- 

матизир -, ... 

О (& сов, Г, а, Ф, ся, | ся) — потер’ |, ... 

(1, несов, П,й,ф, ся, |ся) —> стро] +, крас’ -, 

люб’ -, ... 

(#, сов, П, Й, А, ся, | ся) —> раздел’ |, ... 

(1, сов, Ш, й, ЫВА, ся,  |ся) — спрос’ -[, 

(1, несов, Г, а, ф, ся, |ся) > стон -[, ... 

(1, несов, Г, а, ф, ся, ся) — сме] -, ... 

(+, сов, Га, ЫВА, ся, ` |ся) -* опозд -, ... 


*) Правила группы У Ш не нумеруются, поскольку каж- 
дая строчка здесь представляет целый набор‘ правил, число 
которых определяется количеством привлекаемых основ с 
данной информацией, 
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1Х. Морфонологические правила. 
_1. а: + а› — @ - 70, (где а1 и а, — произволь- 

ные гласные) 

2. у ии 

3. оХ - вва > аХ -|{ ыва 

Здесь Х — сокращенное обозначение произволь- 
ной цепочки не длиннее трех символов. Имеется 
в виду чередование о/а в глагольных корнях типа 
опозд-ать/опазд-ывать. Как кажется, группа со- 
гласных, следующая в корне за чередующимся о 
(т.е. отделяющая его от суффикса -ыва-), не может со- 
держать больше трех букв. 


7 , 
“. 6 т ох} здесь Х = они, ыва 
5. д онн —> д’ он 

се онн — с’ | онн 


6. нн -- Ф (кф) > н- Ф(кф). 
Х. Графическо-орфографические 
правила. 
41. та» я 2. Х’-а->хХ я 
ую Х’ у Х -ю 
1-Ро— е Х’-о— Х-е 


... Хы Х -и 
1а—>я Х’и--Х и 
Ию ——_^ 
1о->е здесь Х — любая согласная 


3. а здесь Х =ж,ч, ш, щ 
ХГ. Стирание показателя грани- 
цы между морфами 
Х-У-—ХУ 
Здесь Х и У — любые такие морфы, что к Х + У 
неприменимо ни одно из правил групп ХХ. 


*) Данное правило безоговорочно верно лишь для 0 В 
глагольных суффиксах (т. е. в суффиксах, присоединяемых 
к глагольным основам). 
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Данное ограничение на Х и У препятствует тому, 
чтобы граница между морфами была стерта слишком 
рано, до применения соответствующих морфоноло- 
гических правил. В противном случае такие морфо- 
нологические правила не были бы применены, а это 
привело бы к неправильным результатам (например, 
можно было бы получить *опоздывавший, *спросен- 
ный): дело в том, что если какое-либо морфоноло- 
гическое правило мо жет быть применено, то оно 
должно быть применено обязательно. 


Понятия выводимости и вывода; 
язык, порождаемый грамматикой 


Итак, на примере Г, мы описали устройство фор- 
мальной порождающей грамматики. Теперь введем 
следующие три понятия, необходимые для описания 
того, как применяется грамматика, т. е. для описа- 
ния самого процесса порождения. 

Непосредственная выводимость. 
Если имеются две цепочки Х и У, причем Х = 2.АЙ,, 
а У = 1,82, (7, и/или #, могут быть пустыми) и 
в грамматике Г имеется правило А —> В, то У непо- 
средственно выводима в Гиз Х. Другими словами, Х 
может быть переработана в У за один шаг — приме- 
нением одной подстановки: У получается из Х 
подстановкой В на место некоторого вхождения 
цепочки А. Например, из цепочки 


«О(Ьсов,Т,и,А,ся, |ся) и-ЕС (акт, прош, 1) Ф» 
по правилу УТ.5 непосредственно выводима цепочка 
«О (Ё сов, П, И,А, ся, ся) и -- ви -ЕФ». 


Выводимость: Если имеется последова- 
тельность цепочек Х., Х\, ..., Х», в которой каждая 
следующая цепочка непосредственно выводима из 
предыдущей, то Х, выводима из Х,; сама же 
последовательность Х., Х,, .... Х, называется 
выводом Х, из Х.. Это означает, что Х, пере- 
рабатывается в Х, не обязательно за один шаг, 
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а последовательным применением нескольких под- 
становок. Очевидно, что непосредственная выводи- 
мость есть частный случай выводимости. 

Приведем пример вывода в изложенной 
грамматике Г, *). 


ПРИЧ 


(Г) ПРИЧ (пасе, прош, невозвр) 

(11.6) О’ (, сов, п, и, ф, ся, |ся)С (пасе, прош, П) Ф 
(П1Т.1)0 (Е, сов, П,и,ф, ся, | ся)ТС (пасе, прош, 1) Ф 
(УТ.9) О ($, сов, П, и, ф, ся, |ся) Тонн + Ф 

((ГУ.2) О (Ь сов, Пи, $, ся, `] ся)онн -- Ф 

(УП.1)0 (& сов, П, и, ф, ся, | ся) они -- Ф (пф) 
(УП.45) О (&, сов, П, и, $, ся, |ся)онн - ыми 
(УПТ. .’.) покрас’ + онн | ыми 

(1Х.4) покраш - онн - ими 

(Х.3) покрашРеннРыми 

(ХТ) покрашенними 


Такой вывод (начинающийся начальным симво- 
лом и заканчивающийся цепочкой, состоящей 
только из терминальных символов) называется пол- 
ным. Разумеется, не всякий вывод, начинающийся 
начальным символом, является полным; возможны, 
в частности, и такие выводы, начинающиеся началь- 
ным символом, которые невозможно продолжить 
до полного вывода, — «тупиковые выводы». 

Приведем пример тупикового вы- 
вода в Г. 


ПРИЧ 


(Г) ПРИЧ (акт, наст, возвр) 
(11.1)О’(Ь, несов, П‚атем,ф,ся, |ся)С (акт,наст, ГП) Фся 
(ПТ.3)О0($, несов Т.атем, ф,ся, |ся)С(акт,‚наст 11) Фся 


*) В скобках (слева от строки вывода) указывается номер 
правила, применение которого к предыдущей строке дает 
данную. 
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(УГ.2)0 (Е, несов, 1, атем, ф, ся, |ся)иц-- Фся 
(УП. 1) О(, несов, ЦП, атем, $, ся, |ся) ащ- 
+- Ф(пфуся 

(УП.11)0 ($, несов, Ц, атем, ф,ся, |ся) ащ -- уюся 
(ХГ о(Ь несов, ЦП, атем, ф,ся ]ся)дащуюся 


Этот вывод продолжить невозможно, хотя он и не 
является полным, т. е. не кончается цепочкой тер- 
минальных символов (русских букв). В грамматике 
Г. нет правила, левая часть которого содержалась 
бы в последней цепочке данного вывода. Это объяс- 
няется тем, что в русском языке не существует ате- 
матических глаголов, спрягающихся по П спряже- 
нию. Таким образом, признаки «атем» и «[», которые 
при построении грамматики Г, трактовались как не- 
зависимые, в действительности являются связанны- 
ми. Их связанность можно было бы учесть, однако 
ото повело бы к заметному усложнению грамматики. 
Мы предпочли не поступать так, поскольку наличие 
в грамматике тупиковых выводов не является, вооб- 
ще говоря, ее недостатком. От «хорошей» грамматики 
вовсе не требуется, чтобы любой вывод в ней закан- 
чивался правильной терминальной цепочкой: доста- 
точно, чтобы любой полный вывод давал правильную 
цепочку (в нашем случае — форму русского при- 
частия). 

Подчеркнем, что порождающая грамматика не 
является алгоритмом *): правила подстановки — 
это не последовательность предписаний, а совокуп- 
ность разрешений. Это означает, что, во-первых, 
правило вида А -> В понимается в грамматике как 
«А можно заменить на В» (а можно и не заменять), 
тогда как в алгоритме 4 -» В означало бы «А следует. 
заменить на ВБ» (нельзя не заменить); во-вторых, 
порядок применения правил в грамматике произво- 


*) Разъяснять здесь, что такое алгоритм, мы не можем, 
однако для понимания данной книги знать это необходимо. 
Читателю, не уверенному, что он в достаточной степени зна- 
ком с понятием алгоритма, рекомендуется обратиться хотя бы 
К статье «Алгоритм» в «Философской энциклопедии», т. 1 
(М., 1960), 38—42, или к книге Б. А. Трахтенброта (1960). 
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лен (любое правило разрешается применять после 
какого угодно), тогда как в алгоритме был бы задан 
жесткий порядок применения отдельных инструк- 
ций. Однако необходимо помнить, что одно дело — 
разрешение применить правило, а другое дело — 
возможность сделать это: правило удается применить 
лишь к такой цепочке, которая содержит вхождение 
его левой части (так, правило АВ-> СО можно 
применить к цепочке АДЕАВБС, но пе к цепочке 
ААЛЕВС). Поэтому фактически порядок применения 
правил может диктоваться ими самими. Напри- 
мер, в грамматике Г, правила могут применяться 
в процессе вывода только в некотором определенном, 
почти жестком порядке, хотя для Гу, как и вообще 
для любой грамматики, никаких внешних ограниче- 
ний на порядок работы правил не существует. Так, 
в любом полном выводе никакое правило группы ПШ 
не может быть применено раньше правила группы 
ПП, поскольку в левые части правил группы Ш 
входит символ О’, который может появиться в обра- 
батываемой цепочке только в результате применения 
одного из правил группы П; аналогично, правило 
ГУ.1 или ГУ.6 не удастся применить раньше правила 
группы УГ и т. п. 

Чтобы лучше освоиться с понятиями грамматики 
и вывода, читателю будет полезно построить несколь- 
ко полных выводов в грамматике Го, т. е., действуя 
чисто механически, породить ряд словоформ прича- 
стий. Для этого надо взять начальный символ 
«ПРИЧ», выбрать любое правило подстановки, имею- 
щее в левой части этот символ, и применить его; 
далее, выбрать любое правило, применимое к полу- 
ченному результату, применить его ит. д. В качестве 
образца можно пользоваться примером вывода на 
стр. 44. 

Язык. порождаемый граммати- 
кой. Совокупность всех терминальных цепочек *), 
выводимых из начального символа в грамматике Г, 


*) Терминальная цепочка — цепочка, состоящая только 
из терминальных символов, см. стр. 36. 
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называется языком, порождаемым грам- 
матикой, и обозначается Г (Г). Следует под- 
черкнуть, что такое употребление термина «язык», 
введенное Н. Хомским, не совпадает с более приня- 
тым в лингвистике (а также и в математике) его тол- 
кованием. Хомский, разлитая систему и бесконеч- 
ное, вообще говоря, множество результатов ее ра- 
боты, называет первую грамматикой, а второе — 
языком. Обычно же в лингвистике, начиная с Ф. де 
Соссюра, языком называют, как известно, именно 
систему, а результат ее работы — речью. Однако, 
говоря о порождающих грамматиках, пользоваться 
такой терминологией по ряду причин (в основном 
языкового характера) неудобно; ср., например, 
*различные речи, порождаемые языками и т. п. 
К тому же терминология Хомского стала общепри- 
нятой и привычной в данной области. Поэтому и 
мы будем пользоваться ею при изложении теории 
порождающих грамматик. В других случаях термин 
«язык» используется нами в обычном для лингвисти- 
ки смысле; однако из контекста всегда видно, какой 
смысл имеется в виду. 

В нашем примере язык, порождаемый грамма- 
тикой Г.,— это совокупность всех причастий от 
указанных выше глаголов. Очевидно, что этот язык 
конечен. Однако грамматики могут порождать 
и бесконечные языки — ср. хотя бы грамматику 
Г., стр. 55—57. 

Таким образом, применение грамматики — это 
построение полных выводов; последние цепочки этих 
выводов и образуют язык, порождаемый граммати- 
кой. 

Отметим, что возможна ситуация, когда две раз- 
ные грамматики порождают один и тот же язык, 
т. е. одно.и то же множество терминальных цепочек; 
в этом случае грамматики называются эквива- 
лентными. 

Теперь, подводя итог, мы можем окончательно 
сформулировать определение формальной порож- 
дающей грамматики (в дальнейшем мы будем гово- 
рить для краткости просто «грамматика»): 
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Грамматика есть упорядоченная четверка 
‹7, 7,, Т, 5›, где 1)—2) 7 и7,—не пересекающиеся 
конечные множества символов, называемые соответ- 
ственно основным и вспомогательным словарями, 
3) Г — выделенный элемент из Й\, называемый на- 
чальным символом, 4) & — конечное множество 
выражений вида А > В, где А и ВБ — цепочки, 
состоящие из основных и вспомогательных символов 
(цепочкинад Я |} Й,), а«>›— символ, не при- 
надлежащий ни 7, ни7,; эти выражения называются 
правилами грамматики, а множество 
5 — схемой грамматики. 


Та 
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Грамматики, отвечающие только что приведенно- 
му определению, представляют собой порождающие 
устройства очень общего характера: они способны 
порождать любые (!) множества цепочек, какие 
только вообще могут быть порождены каким-либо 
автоматическим устройством *). Однако множество 
фраз естественного языка — это множество, обла- 
дающее рядом специфических свойств. (Важное за- 
мечание: изучая фразы естественного языка в аспекте 
теории формальных грамматик, их обычно рассмат- 
ривают как цепочки словоформ или морф, высту- 
пающих в роли терминальных символов.) В частно- 
сти, естественно полагать, что для множества фраз 
существует распознающий алгоритм — способ узна- 
вать относительно каждой предъявленной цепочки, 
является ли она фразой данного языка; нри этом не 


‚ обязательно предполагается деление всех фраз только 


на правильные и неправильные — можно допустить 
класс или классы промежуточных случаев. Это мне- 
ние вытекает из наблюдения фактов: носитель языка 
всегда может оценить правильность предложенной 
ему фразы, даже если он никогда не слышал ее рань- 
ше; стало быть, он пользуется каким-то распознаю- 
щим алгоритм эм, строение которого ему, однако, не 
известно. Более того, этот алгоритм должен обладать 
определенными специфическими свойствами: в част- 
ности, он всегда выдает ответ достаточно быстро. 


*) Множества, порождаемые автоматическими устройст- 
вами произвольного вида, в теории алгоритмов называются 
рекурсивно перечислимыми. Тот факт, что любое рекурсив- 
но перечислимое мпожество порождается некоторой грамма- 
тикой, строго доказан (Рау!ез 1958, глава 6, $ 2; Гладкий 
1966, стр. 143; см. также идею доказательства в Хомский 
1966, стр. 139). 
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Множества, для которых существуют распознающие 
алгоритмы, называются рекурсивными *), а те из 
них, для которых эти алгоритмы достаточно просты, 
т. е. выполняются в «не очень большое» число шагов, 
образуют еще более узкий классе и называются ниже 
«легко распознаваемыми множествами». Если мы 
хотим, чтобы грамматика порождала фразы естест- 
венного языка и только их, то на грамматики, опре- 
деленные на стр. 48, необходимо наложить такие 
ограничения, чтобы порождаемые ими множества 
были рекурсивными и, более того, легко распозна- 
ваемыми. Представляется естественным, чтобы эти 
ограничения относились к правилам, т. е. к характе- 
ру замен: что именно и на что разрешается заменять. 


Неукорачивающие грамматики 


Можно начать с требования, чтобы в правиле 
вида А —> В цепочка В не была короче цепочки А; 
тогда в процессе вывода цепочки не будут укорачи- 
ваться **). Оказывается, что уже этого, столь незначи- 
тельного на первый взгляд, ограничения достаточно 
для нашей цели: языки, порождаемые «неукорачи- 
вающими» грамматиками, являются легко распозна- 
ваемыми! Этот важный факт строго доказывается, 
причем доказательство, при всем его значении для ма- 
тематической лингвистики, весьма просто, и мы при- 
ведем его здесь, чтобы в какой-то степени ознакомить 
читателя с «кухней» математической лингвистики. 

Рассмотрим неукорачивающую грамматику Г, 
содержащую р символов (терминальных и нетерми- 


*) Всякое рекурсивное множество является рекурсив- 
но перечислимым, обратное же неверно: не для всякого ре- 
курсивно перечислимого множества существует распознаю- 
щий алгоритм. 

**) Под длиной цепочки понимается число символов в неи; 
например, длина цепочки ААВС- Ш равна 5. Заметим, что 
грамматика Г, не удовлетворяет указанному требованию — 
в ней имеются «укорачивающие» правила, а именно ГУ.1, 
ТУ.2, [Х.2, [Х.6, Х.1 и ХГ (см. стр. 40—42). Однако язык 
Г (Го) является рекурсивным, хотя бы уже потому, что он 
конечен. 
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нальных вместе). Возьмем произвольную цепочку х 
длины п, состоящую из терминальных символов. 
грамматики Г. Чтобы доказать, что Г (Г) — легко 
распознаваемое множество, достаточно указать ал- 
горитм, который для каждой такой цепочки за 
«не очень большое» число шагов решал бы, выводима 
она из начального символа грамматики Г или нет. 
Такой алгоритм существует; его идея заключается 
в следующем. Он строит один за другим всевозмож- 
ные выводы в грамматике Г из начального символа Т. 
Построение каждого вывода состоит в том, что сна- 
чала к Т применяется произвольное (применимое 
к Т) правило грамматики Г, затем к результату снова 
применяется какое-либо правило и т. д.; количество 
применений правил в данном выводе называется его 
длиной (заметим, что длина вывода равна числу 
цепочек в нем, не считая начального символа). 
Завершив построение каждого очередного вывода, 
алгоритм проверяет, не оканчивается ли он рассма- 
триваемой цепочкой х. Если да, то процесс обрыва- 
ется, так как тем самым получен ответ: цепочка х 
выводима из Г. Если нет, то процесс продолжается. 
Чтобы этот процесс не был бесконечным, алгоритм 
должен «знать», где остановиться, т. е. когда пре- 
кратить построение новых выводов. Этого можно 
добиться, если задать алгоритму такое конечное мно- 
жество выводов ЛМ, что если ни один из выводов, 
входящих в /Л[, не оканчивается цепочкой х, то и 
вообще никакой вывод не оканчивается этой цепоч- 
кой. Тогда, перебрав все выводы из М и не найдя 
среди них ни одного, оканчивающегося на х, алго- 
ритм должен; прекратить работу и выдать отрица- 
тельный ответ: х не выводима из Г. При этом 
еще недостаточно, чтобы множество М просто сущест- 
вовало; необходимо также, чтобы мы умели эффектив- 
но находить /М по заданной цепочке х. 

Укажем способ построения множества М по про- 
извольной цепочке х. Если цепочка х длины п выво- 
дима из начального символа Г грамматики Г, то 
имеется вывод — последовательность цепочек, ве- 
дущая от Гкх. Можно считать, что в этом выводе ни 
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одна цепочка не повторяется: в противном случае 
образовавшуюся «петлю» можно безболезненно вы- 
кинуть. Поскольку наша грамматика неукорачиваю- 
щая, ни одна из цепочек этой последовательности 
не может быть длиннее цепочки х, т. е. иметь длину 
больше и. (Именно здесь и использован существенным 
образом тот факт, что грамматика Г является неуко- 
рачивающей!) Число же различных цепочек длины. 
не превосходящей п, которые можно составить из р 
символов, заведомо не больше чем 


п-1.1 


рт р рее... рр = Г 


(сумма геометрической прогрессии) < р". 

Стало быть, вывод цепочки х из Т, если он суще- 
ствует, обязательно содержится среди всех возмож- 
ных бесповторных последовательностей, составлен- 
ных из р" = Р разных цепочек. А таких после- 
довательностей заведомо не больше чем 


Р!-- Сь.(Р— 1) 1+ СЪ. (РЬ-2)!-... 
... Сь?.21 + СР1. 11%) 


") 


*) Число цепочек длины пиз р символов равно р", число 
цепочек длины (п — 1) из р символов равно р"? ит. д.; чвс- 
ло цепочек из О символов равно р = 1 (цепочка длины 0 — 
пустая цепочка — единственна). Заметим еще, что здесь всег- 
да р>1, поскольку основной и вепомогательный словари 
предполагаются непустыми. 

#*) Поясним, как получается это выражение. Если имеется 
Р разных элементов и мы строим из них бесповторные последо- 
вательности, то длина каждойтакой последовательности не пре- 
восходит Р: она равна Р, если в последовательность входят все 
элементы, или меньше Р в противном случае. Последователь- 
ностей длины Р из Р элементов имеется Р! (число перестано- 
вок из Р элементов). Последовательпостей длины Р — 1 из 
данных Р элементов имеется (Р — 1)!-Р (из данных Р — 1 
элемента можно составить (Р — 1)! последовательностей, 


а выбрать Р1 элемент из Р элементов можно Р= СЪ спосо- 
бами). Аналогично, последовательностей длины РЫ— 2 из 
данных Р элементов имеется (Р — 2)!. СЪ (поскольку Р— 2 


элемента можно выбрать из данных Р элементов именно СЪ 
способами) и т. д. 
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В этой сумме Р членов; ее А-й член равен 


: Р Р! 
СЬ.(Р—№! = тер '(Р-Ю! = - <Р!.*) 


Поэтому вся сумма не больше чем Р!.Р < (РУ)! = 
= (ри + 1)! < (р"?)!. Те из полученных (р”*?)! 
последовательностей, которые являются выводами 
в грамматике Г, и образуют искомое множество М. 
Перебирая их, мы либо обнаружим нужный вывод, 
либо убедимся, что его нет. 

Указав алгоритм распознавания выводимости 
произвольной цепочки в грамматике Г, мы доказали 
тем самым, что Г, (Г) — рекурсивное множество; 
поскольку этот алгоритм дает ответ не более чем в 
(р”*?)| шагов **) для любой цепочки длины п, то 
Г, (Г) — легко распознаваемое множество. Следует от- 
метить, что понятие «не очень большое» (число ша- 
гов) — вещь условная; на самом деле, число (р"*2)!, 
очевидно, настолько велико, что предложенный ал- 
горитм практически неосуществим даже с помощью 
самых мощных ЭЦВМ. Однако в теории алгоритмов 
часто встречаются рекурсивные множества, для рас- 
познавания которых требуется несравненно большее 
число шагов, и даже такие рекурсивные множества, 
для которых число шагов распознающего алгоритма 
вообще не может быть оценено заранее. 

Таким образом, выбрав множества, где число ша- 
гов при распознавании находится в указанной за- 
висимости от длины цепочки, мы сразу выделили в 
классе рекурсивных множеств достаточно узкий 
подкласс. 


*) Здесь используется известная формула числа сочета- 


ео 


НИИ: 
к Р! 
= (РЕ 


**) Под «шагом» здесь подразумевается построение очеред- 
ного вывода вместе с проверкой, не оканчивается ли он на х. 


"Т, 4.2 
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Грамматики непосредственно 
составляющих (НС-гранмнатики) 


Для удобства изучения неукорачивающих грам- 
матик целесообразно ввести еше одно ограничение, 
которое не изменяет класса порождаемых языков, 
но зато делает правила грамматики более простыми 
и единообразными по структуре, а потому обеспечи- 
вает элементарность каждого шага в выводе. Именно, 
потребуем, чтобы в каждом правиле Х —> У левая 
часть (Х) имела вид й,Сй., где С — в точности один 
символ (удобно согласиться, чтобы этот символ был 
всегда вспомогательным), а правая часть (У) — вид 
2.И’2., где И’ — непустая цепочка (непустота це- 
почки Й7 следует из того, что грамматика является , 
неукорачивающей). Таким образом, на каждом шаге 
вывода разрешается заменять только один символ. . 
Грамматики, удовлетворяющие сформулированному 
ограничению, называются грамматиками не- 
посредственно составляющих, или со- 
кращенно — НС-грамматиками. Понятно, 
что шаг вывода в неукорачивающей грамматике, 
состоящий в одновременной замене нескольких сим- 
волов, может быть разбит на несколько шагов, 
состоящих каждый в замене только одного сим- 
вола. Отсюда видно, что для любой неукорачиваю- 
щей грамматики может быть построена эквивален- 
тная ей НС-грамматика *). 


*) Не приводя полного доказательства этого утвержде- 
ния, поясним ‘его идею на частном случае правила вида 
АБ -› ВА, где А и В — вспомогательные символы. Такое 
правило может быть заменено четырьмя НС-правилами: 

АВ-—>1В 

1В ->› 12 

12-> В2 

В2-› ВА 
(здесь 1 и 2 — новые вспомогательные символы, которые 
не встречаются ни в каких старых правилах). Ясно, что по- 
следовательное применение этих правил равносильно приме- 
нению правила АВ -› ВА, причем замена ими этого послед- 
него не может привести к появлению «лишних» выводов, по- 
скольку символы 1 и 2 -- новые. 
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НС-грамматики обладают следующим важным 
в лингвистическом аспекте свойством. 

Будем истолковывать терминальные символы как 
словоформы (некоторого естественпого языка), вспо- 
могательные символы — как синтаксические кате- 
гории (например, ИУ — глагол, 5 — существитель- 
ное, А — прилагательное, 7 — группа глагола, 


5 — группа существительного), начальный сим- 
вол — как «Предложение», а выводимые терминаль- 
ные цепочки — как правильные предложения `дан- 
ного языка. Тогда вывод предложения естественно 
интерпретируется как его синтаксическая структура, 
представленная в терминах непосредственно состав- 
ляющих, т. е. способом, давно известным в лингвисти- 
ке. Поясним сказанное примером. Построим грамма- 
тику Г,, которая будет порождать некоторые русские 
фразы, синтаксически однотипные и очень простые. 
Мы выпишем только схему этой грамматики; ее 
терминальными символами будут русские словофор- 
мы, а вспомогательный словарь содержит вышеназ- 
ванные синтаксические категории. Символы этих ка- 
тегорий снабжены индексами, соответствующими их 
морфологическим признакам, например 5х ед, род. На- 
чальный символ обозначается через «ПРЕДЛ» (Пред- 
ложение). 


Схема грамматики Г,*) 


Следует иметь в виду, что каждая строка в данной 
схеме представляет собой не одно правило, а сокра- 
щенную запись нескольких правил (ср. выше, 
стр.39—40). Так, строка 1.1 представляет 648 правил: 


— 


м, ед, им, 3—5, ед, им, 3 $, ед, род, 1 


бы, ед, род, 3-> м, ед, род, зы, ед, род, 1 


— 


ср, мн, предл, 3— ср, мн, предл, ср, мн, род, 3 


*) Смысл используемых обозначений разъясняется ниже, 
после схемы грамматики, 
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Такой же способ сокращения применяется и в после- 
дующих примерах. Тем не менее для простоты форму- 
лировок мы будем называть строки таких сокращен- 
ных записей «правилами». 

Г. Выбор общей структуры пред 
ложения. 


ПРЕДЛ —> = 9, у, им, ой, наст, НЕ 


П. Развертывание именной 
группы. 


1. 5х, у, 3-х, у, 2, Зои, у’, род, ш 
2. 5х, у, 2:3 —> Ах, у, г9х, у, 1,3 


=> мест 
3. Кубх, и, 1, шКз -> Клоуз, у, г, Ко 


где К, — символ, отличный от символа Ах, ух, 
а К, — символ, отличный от символа с индек- 
сом 2” = род. Символы А; и К. являются здесь кон- 
текстными ограничениями. Содержательный смысл 
их введения в данное правило заключается в том, 
что главный член именной группы не должен реали- 
зовываться личным местоимением, если ему пред- 
шествует определение, выраженное согласованным 
прилагательным, или если за ним следует именная 
группа в род. падеже; ср. невозможность *новый я *) 
или *он нежности. 


4, 9х, у, 2, 3 — 5х, у, 2 
ИГ. Развертывание глагольной 


группы. 


1. 7, наст, > У,, наст, м 5х”, 1’, дат, шо, и”, твор, 10” 
2. , наст, № * У,, наст, 19 9, 1)”, твор, ших", у”, дат, им” 
3. У,, наст, =” ",, наст, ю 9х, 1’, дат, и’ 
4 


. Т,, наст, > У,, наст, 12 5х, у’, твор, и’ 


*) В поэтической речи подобные сочетания допускаются: 
в четыретлетнюю меня (М. Цветаева). 
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т“ 

ГУ. Реализация синтаксических 
категорий словоформами. 


4. Эм, 1, 2 —> взгляду, гл К 
2. Эл, — Нежность, „,... 


3. Эер, „‚ — предательство, „,... 


мест 
4. х, ед, 2,1->Я2 


мест 
5. х, ед, 2; 3 -> ТЫ, 


6. А, , : -›сладкийх, у, г, НовЫйх, уз, 
МОЙ х, у, г тТвойЙх, уг... 
Т. Ть, наст, в —>2розиТьу, наст, лру+«* 


(В правилах [У не учтено согласование А с одушев- 
ленными © в вин. падеже.) 

Обозначения: == — символ границы предложе- 
ния, который считается терминальным (в тексте 
левая граница реализуется заглавной буквой пер- 
вого слова, а правая — точкой); х, у, 2, ш — пе- 
ременные, соответствующие роду, числу, падежу, 
лицу (в правилах ГУ они используются для обозна- 
чения словоформ, например, сладкий, сдим=сладкая). 

Пример вывода в грамматике Г, см. на стр. 58. 

Грамматика Г, способна порождать и другие фра- 
зы (которые не обязательно должны быть осмыслен- 
ными), например: -- я грожу твоей нежности. +, 
'Н- сладкое новое мое предательство грозит тобой твое- 
МУ взгляду предательства твоего взгляда предатель- 
ства + ит. п. Более того, грамматика Г, порождает 
бесконечно много разных фраз (в отли- 
чие от грамматики Гу). Дело в том, что в ее состав 
входят так называемые циклические правила — 11.1 
и П.2; особенность такого правила заключается в том, 
что результат его применения содержит вхождение 
его левой части, так что оно всегда может быть при- 
менено к своему собственному результату, что и 
приводит к бесконечному числу фраз: так, наряду 
с группой сладкая нежность можно получить слад- 
кая сладкая нежность, далее сладкая сладкая сладкая 
нежность ит. д., т. е. прилагательное сладкая может 
быть повторено сколько угодно раз. В связи с этим 
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встает исключительно важный и далеко не простой 
вопрос о бесконечности числа фраз в естественном 
языке, относительно которого мы отметим здесь сле- 
дующее. 

Очевидно, что в каждый данный момент число 
слов любого естественного языка конечно. Кроме 
того, максимальная длина встречающихся в языке 
фраз практически ограничена: вряд ли люди употреб- 
ляют фразы более чем, скажем, в 1000 слов (если 
это число покажется недостаточным, можно взять 
любое большее). Отсюда следует, что число фраз 
в естественном языке должно быть конечно. Тем не 
менее столь же очевидно, что указать самую 
длинную фразу невозможно: какую 
бы фразу нам ни предложили, мы всегда в принципе 
можем удлинить ее, добавив к нёй, например, еще 
один однородный член или предложение с который. 
Это означает, что в естественном языке существуют 
принципиальные возможности для построения сколь 
угодно длинных фраз, т. е. потенциально осущест- 
вимы фразы любой длины, хотя на практике слишком 
большие фразы не используются. 

Эта «потенциальная неограниченность» длины 
фраз не может не учитываться формальными грам- 
матиками, поскольку их задачей является моделиро- 
вание именно принципиальных возможностей есте- 
ственного языка. Если же длины фраз, порождае- 
мых грамматикой, неограниченны, то множество всех 
этих фраз бесконечно. 

Кроме того, когда мы рассматриваем множество 
фраз как бесконечное, правила обращения © ними 
получаются более однотипными, а описание в целом— 
как это ни парадоксально на первый взгляд — более 
простым и более глубоким, т. е. позволяющим 
вскрыть более существенные закономерности. Совер- 
шенно аналогичная ситуация имеет место, например, 
в арифметике: натуральные числа, с которыми лю- 
дям приходится иметь дело в каких бы то ни 
было практических задачах, не бывают «слишком 
‘большими» — так, навряд ли когда-либо было 
использовано число, большее 10100. Тем не менее 
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арифметика исходит из неограниченности натурально- 
го ряда (ведь принципиально они в самом деле ничем 
не ограничен), и именно это делает ее законы весьма 
общими и простыми, а потому удобными для приме- 
нения и в тех задачах, в которых «слишком большие» 
числа не встречаются. 

Что же касается практической ограниченности 
длины фраз, то это обстоятельство само по себе очень 
важно и полная теория языка, безусловно, должна 
его учитывать. Однако природа этого явления отно- 
сится к иному аспекту языка — не к тому (синтак- 
сическому) аспекту, моделировать который призва- 
ны формальные грамматики; поэтому в рамках этих 
последних оно и не отражается. 

Разумеется, в результате истинная картина суще- 
ственно огрубляется. Однако здесь нет ничего неожи- 
данного; напомним, что во Введении (стр. 140) спе- 
циально отмечалась неизбежность огрубления при 
математическом моделировании. Именно так обстоит 
дело и с формальными грамматиками, причем огруб- 
ление происходит здесь не только из-за неучета 
практической ограниченности длины фраз, но и в го- 
раздо большей степени, например, из-за полного иг- 
норирования семантического аспекта, в частности 
семантической сочетаемости. Чтобы отразить эти, 
а также и другие нужные аспекты, необходимо стро- 
ить наряду с формальными грамматиками модели 
иного типа, специально приспособленные для описа- 
ния таких аспектов. (О попытках моделирования се- 
мантики см. ниже, стр. 153 и сл.) 

Вернемся теперь к нашему примеру вывода на 
стр. 58. Каждый шаг этого вывода состоит либо в раз- 
вертывании одного из символов предыдущей цепочки 
(так, при переходе от цепочки 2 к цепочке 3 символ 

У сд,наст.з_ развертывается в три символа — Т.д наст,3 


был, ат, ‚Зе, сд.твор,з), Либо в замене его другим 
(например, при переходе от цепочки. 10 к цепочке 


11 символ би. сддат1 ЗАменяется на мед дат.1), Прочие 
же символы переписываются *) без изменения. 


*) См. Приложение 11, стр. 186, Правила подстановки. 
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Назовем развертываемые, заменяемые или перепи- 


сываемые символы «предками», а символы, кото- 
рые получаются в результате развертывания, за- 
мены или переписывания — их «потомками» (потомки 
потомков также суть потомки). Соединим предков 
линиями с их непосредственными потомками. Тогда 
у нас получится не что иное, как хорошо знакомое 
лингвистам дерево составляющих, или синтаксиче- 
ская структура фразы в терминах непосредственно 
составляющих (НС-структура) *). Чтобы показать 
это более явно, устраним из схемы на стр. 58 все 
символы-потомки, переписываемые без изменения 


(например, быеддат. В Цепочках 4—10) и объеди- 
ним однотинные шаги 4—5, 5—би 6—7, изобра- 
зив их на одном уровне. Получится дерево, изобра- 
женное на стр. 62. 

Представление синтаксической структуры в тер- 
минах НС широко принято в лингвистике, многократ- 
но исследовалось в самых разных аспектах и, безу- 
словно, завоевало право гражданства как в чисто 
теоретическом плане, так и в работах эксперимен- 
тального характера (автоматический перевод и т. п.). 
Поэтому тот факт, что грамматики, определенные 
на стр. 54, при порождении терминальных цепочек, 
например, фраз естественного языка, одновре- 
менно дают их НС-структуру (вывод 
фразы фактически и есть ее НС-структура), делает 
их 060бо интересными с лингвистической точки 
зрения. 

Произвольная неукорачивающая грамматика (без 
требования заменять сразу только один символ) уже 
не обладает свойством сопоставлять фразам их 
НС-структуры. Поскольку в такой грамматике каж- 
дый раз заменяется, вообще говоря, не один символ, 
а целая группа символов, в выводе невозможно одно- 
значно указать для каждого символа его предка, 
и поэтому вывод не может быть превращен в НС- 


структуру. 


*) О составляющих см. также ниже, стр. 164 и сл. 
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Контекстно-свободные грамматики 
(&С-грамматики) 


Обратим внимание на то, что, хотя в правилах 
НС-грамматики заменяется только один символ (С, 
стр. 54), левая часть правила (Х) не обязательно со- 
стоит только из этого символа: в левой части слева 
и справа от С могут присутствовать другие символыы— 
контекст, т. е. Х может иметь вид 2,С7.. Тогда пра- 
вило вида 2,С7. —> 7. И’2, означает разрешение заме- 
нять С на И’ только в контексте 1,...0.. Сам контекст 
при этой замене переписывается без изменения. При- 
мером правила с использованием контекста является 
в грамматике Г, правило 11.3. Назовем такие правила 
контекстно-связанными, а правила, не исполь- 
зующие контекста (т. е. правила вида Х -»У, где 
Х—один символ), — контекстно-свободными. 
Грамматики, содержащие только контекстно-свобод- 
ные правила, называются контекстно-сво- 
бодными, или ИКС-грамматиками*). Языки, 
порождаемые КС-грамматиками, естественно называть 
КС-языками. 

КС-грамматики представляют собой важный част- 
ный случай НС-грамматик. Их ценность обусловлена 
следующими двумя обстоятельствами. Во-первых, 
отказ от контекста, т. е. требование, чтобы в левой 
части правила был ровно один символ, делает струк- 
туру грамматик еще более простой, что облегчает 
их изучение. Во-вторых, хотя в естественных языках 
замена одних единиц другими часто допустима лишь 
в определенных контекстах, целесообразно исследо- 
вать возможность описывать языки, отвлекаясь от 
указанного факта. Это позволяет четко разграни- 
чить случаи, где использование контекста действи- 
тельно необходимо, и случаи, где в принципе 
можно обойтись и без контекста. В частности, 
особый интерес представляет исследование ситуаций, 
где контекст содержательно необходим, но формально 


*) НС-грамматики, содержащие  контекстно-связанные 
правила, называются соответственно контекстно-свя- 
занными грамматиками. 
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он может быть учтен с помощью контекстно-сво- 
бодных правил, т. е. перестает рассматриваться 
как контекст; этого можно достичь введением в грам- 
матику новых категорий. Так, в грамматике Г, 
контекстно-связанное правило 11.3 может быть ус- 
транено, если преобразовать грамматику следующим 
образом: 1) во вспомогательный словарь вводятся но- 


вые символы 5”’.у. ивтерпретируемые как неме- 
стоименные именные группы, в отличие от символов 


5х, у, г, обозначающих произвольные именные груп- 


пы; 2) правило П.З заменяется двумя новыми прави- 


мзет 
лами: бжуаш- хуш И биг 3> Я. 3) в пра- 


вилах 1.1, П.2 и П.4 все вхождения символов 
5 хзуз#.з ' заменяются символами б,у,ш. Содержа- 
тельно это означает вот что: при развертывании про- 


извольной именной группы 5, уз:,ш В Конструк- 
цию А -- 5 или 5 - 5 род надо следить за тем, чтобы 
в позиции главы конструкции не оказалось личное 
местоимение типа я, вы, он, которое не может иметь 
при себе определений (А или род: *новый я или 
*мы взгляда). Это может быть обеспечено разными 
способами. Один из них использован в грамматике 
Г: личные местоимения считаются существитель- 
ными (хотя и особого класса — 5мет) и рассматри- 


ваются как именные группы (5) наравне с «обычными» 
существительными; однако переходить от именной 
группы 5 к 5мест разрешается лишь при условии, 
что это ® раньше не «выделило из себя» А влево или 
Юрод вправо (см. правила П.1 и 1.2), т. е. если слева 
от заменяемого символа нет прилагательного, 
асправа нет группы существительного в род. падеже. 
Это условие учитывается правилом П.3З. При другом 
способе (см. выше) местоимения также считаются 
особым классом существительных, однако наряду 
с категорией «произвольная именная группа» 5 
вводится категория собственно именной (неместоимен- 
ной) группы 5", и символ & в ходе вывода — до его раз- 
вертывания — "обязательно заменяется либо на сим- 
вол 5мест (который не может развертываться далее), 
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либо па символ 5’ (который развертывается обычным 


образом); А и 5род могут появиться только из 5”, 
однако 5’ не может превратиться в местоимение. 
Возможен и третий способ: не считать местоимения 
существительными и с самого начала вывода исполь- 
зовать для них особый символ М; тогда многие пра- 
вила грамматики Г, придется продублировать, на- 
пример, наряду с правилом [ ввести правило Г: 
ПРЕДЛ -+ Мед им ед.настю; наряду с правилом 
1.3 — правило 11.3’; Й’,,насть-—> Ту наст М х’ лу’ датию”, 
и т. д. При третьем способе полученная грамматика ` 
также будет контекстно-свободной, 


Таким образом, разобранный пример показывает, 
что в естественных языках возможны ситуации, когда 
явления, которые представляются существенно зави- 
сящими от контекста, могут, по-видимому, описывать- 
ся и как не зависящие от контекста, т. е. в терминах 
КС-грамматик. При этом, разумеется, описание мо- 
жет усложниться в других отношениях, например, 
может понадобиться много новых категорий и/или 
правил. В каждом отдельном случае надо решать, 


что предпочтительнее, исходя из конкретной задачи 
описания. 


Не следует, однако, думать, что всякая кон- 
текстно-связанная НС-грамматика может быть заме- 
нена эквивалентной ВКС-грамматикой. Известно, что 
существуют .НС-языки, не являющиеся КС-языка- 
ми, например, язык, состоящий в точности из все- 
возможных цепочек вида а"ф"а" (аба, аабФаа,...) 
или из всевозможных цепочек вида 276"с”. 


Почти все имеющиеся Яримеры НС-языков, не 
являющихся КС-языками, носят абстрактный ха- 
рактер и не имеют интерпретаций в естественных 
языках. Ср., впрочем, примеры на стр. 92 и сл. 

Итак, до сих пор мы занимались введением все 
новых и новых ограничений на классы рассматривае- 
мых грамматик. Сначала мы потребовали, чтобы чис- 
ло символов в правой части правил было не меньше, 
чем в левой, и получили неукорачивающие грамма- 
тики. Затем мы потребовали, чтобы замене подвер- 


3 А. Гладкий, И. Мельчук 
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гался только один символ, и получили НС-грамма- 
тики. Наконец, мы потребовали, чтобы в левой части 
правила вообще был только один символ, и получили 
КС-грамматики. Ясно, что никаких дальнейших 
естественных ограничений на левые части правил 
наложить уже нельзя. Поэтому, если мы хотим вы- 
делить еще более узкие классы грамматик (о целе- 
сообразности такого подхода речь пойдет ниже), 
придется накладывать ограничения на правые части 
правил. 


Бинарные ЕС-грамматики 


Начнем с числа символов: потребуем, чтобы пра- 
вая часть любого правила содержала не более двух 
символов (очевидно, что два — это минимальное 
число: если в правых частях допускать только по 
одному символу, порождаемый язык будет состоять 
из одноэлементных цепочек, что не интересно). 
В результате получится частный класс КС-грамматик 
(назовем их бинарными), обладающих той особен- 
ностью, что в соответствующих им деревьях состав- 
ляющих (т. е. в синтаксических структурах фраз, 
получаемых из их выводов) из каждой вершины 
исхо.(ит не более двух ветвей. Это значит, что любая 
сложная составляющая всегда состоит ровно из двух 
непосредственно вложенных в нее составляющих, 
т. е. что фраза членится всегда на две половины (на- 
пример, «группа подлежащего» - «группа сказуе- 
мого»), каждая из этих половин опять членится по- 
полам и т. д. НС-грамматики (в частности, ВС-грам- 
матики) без данного ограничения бинарной структу- 
ры не дают. Мы обращаем внимание читателя на этот 
факт потому, что существует тенденция повимать 
НС-структуру обязательно как бинарную. Так, 
грамматика Г, не дает бинарной структуры. Это про- 
исходит благодаря правилам [11.4 и ПП.2, которые 
отражают такое интуитивное понимание строения 
предложения, при котором группа сказуемого счита- 
ется состоящей из как бы лежащих на одном уровне 
личного глагола и групп его дополнений. 


Гал 
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Однако для всякой КС-грамматики можно по- 
строить эквивалентную ей бинарную КС-грамматику. 
Например, КС-грамматика, описанная на стр. 64, 
может быть превращена в бинарную путем замены 
правил 11.1 и 11.2 (стр. 56) следующими новыми 
правилами: 


— 


‚ т 1 Иа. 
ПГ. 1°. У,, наст, „-—> Гу, наст, 10 5х”, у”, твор, ш” 


‚ т то < 
ПТ. 2 . У,, наст, = У,, наст, м 5х", 1”, дат, Ш” 


п ТУ ба 
ПЕ Г. У,, наст, ю-—> Ту, наст, 0 5х, у’, дат, 10’ 
Г ту “т 
Г. 7. У,, наст, — Г, наст, 5", у’, твор, м" 
Кроме того. необходимо еще заменить правило Г, 
5 
имеющее в правой части четыре символа, правилом Г: 


ПРЕДЛ —> 5х, 1), Им, оу, наст, 0; 


тем самым мы устраняем граничные символы (вообще 
в КС-грамматике граничные символы формально не 
нужны, тогда как в НС-грамматике, имеющей кон- 
текстно-связанные правила, граничные символы 
могут быть необходимы в качестве контекста: ср. 
правило П.З в Г,; если же наличие граничных сим- 
волов считается желательным из содержательных 
соображений, то их можно сохранить и в бинарной 
КС-грамматике, однако ради простоты изложения 
мы этого делать не будем). 

Вывод фразы с помощью грамматики, преобра- 
зованной указанным образом, будет давать именно 
бинарную НС-структуру, представленную на стр. 68. 

Введенное ограничение (не больше двух символов 
в правой части правил) можно наложить и на нроиз- 
вольную НС-грамматику, формулируя его, однако, 
несколько по-другому. Именно, потребуем, чтобы 
каждое правило имело вид 21.С7, — 24И’2., где | 
состоит из одного или двух символов. "Такую 
НС-грамматику естественно также назвать бинар- 
ной. Нетрудно показать, что и для всякой НС-грам- 
матики можно построить эквивалентную ей бинарную 
НС-грамматику. 
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Таким образом, любая фраза, описываемая НС- 
грамматикой (в частности, КС-грамматикой) и полу- 
чающая в соответствии с этой грамматикой некото- 
рую НС-структуру, всегда может быть описана би- 
нарной НС-(КС-)грамматикой, т.е. ее НС-структура 
всегда может быть представлена в терминах строго 
бинарных составляющих; это можно сделать «равно- 
мерно», одинаковым образом для всех фраз языка. 
Сказанное здесь есть доказанный факт; однако от- 
сюда отнтодь не следует, что бинарное представление 
фраз естественного языка всегда является удовлетво- 
рительным, естественным с точки зрения содержа- 
тельной лингвистической интерпретации. Теория 
утверждает лишь, что одни и те же явления могут 
быть описаны по-разному: бинарно и небинарно 
(сходная ситуация отмечалась выше — контекстно- 
связанное и контекстно-свободное описания одних 
и тех же фраз, стр. 64). Критерии выбора подходя- 
щего описания лежат вне теории: этот выбор должен 
делаться на основе соображений, относящихся к кон- 
кретным целям и характеру поставленной задачи, 


Автоматные грамматики (А-грамнматики) 


Теперь мы вернемся на наш путь — путь введения 
дополнительных ограничений на рассматриваемые 
грамматики. Поскольку число символов в правой 
части правил уже сделано минимальным, остается 
накладывать ограничения на характер заменяющих 
символов. Потребуем, например, чтобы правая часть 
каждого правила либо состояла из одного символа, 
либо имела вид «БВ», где 6 — терминальный (основ- 
ной) символ, а В — вспомогательный символ (син- 
таксическая категория). В результате мы получим час- 
тный класс КС-грамматик; грамматики этого класса на 
зываются автоматными (А-грамматикамия) *) 


*) Обычно А-грамматики определязот несколько иначе: 
требуют, чтобы в правилах, содержащих в правой части толь- 
ко один символ, этот символ был терминальным. Однако клас- 
сы языков, порождаемых А-грамматиками в смысле того и 
другого определений, совпадают; поэтому мы позволяем себе 
использовать тот же термин. ` 
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Языки, порождаемые А-грамматиками, также назы- 
заются ‘автоматными, или А-языками. 

Важнейшей особенностью А-грамматик является 
специфическая форма вывода. Построим для примера 
А-грамматику Г., имея в виду порождение предло- 
жений типа Сладкая нежность грозит новым преда- 
м (упрощенный вариант предложения со 
стр. 25). 


Схема грамматики Г, 
1. ПРЕДЛ —> 5х, 1, им 


2. Эх уу ->СЛадкИЙх, у, гох, ца 

9. 9х у, -—НОВЫЙх, у, гх у 

4 об, ‚им -> НЕЖНОСТЬ, у, им ,, 3 

5. 5 сруьим > предатель СТВОср, у, им Г,, 3 
6. Эж, у, твор — НЕЖНОСТЬ, у, твор, 

7. 9ер, у, тво» — ПредательствОср, у, твор 

8. Гиз —>ерозитьу, з 9х, у’, твор 


Указанное предложение` будет иметь в данной 
грамматике следующий вывод: 


ПРЕДЛ 
(1) 5’, ед, им 
(2) сладкая 5’н, ед, им 
(4) сладкая нежность Тод, з 
(8) сладкая нежиос‘пь грозит Эез, ед, твор 
(3) сладкая нежность грозит новым 5 ср, ед, твор 


(7) сладкая нежность грозит новым предательс- 
тво.м 


Как мы видим, каждая промежуточная цепочка 
содержит ровно один вспомогательный символ, сто- 
ящий в ней на последнем месте. 

Это означает, что предложение порождается слева 
направо; на каждом игаге выдается конкретная слово- 
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форма, а за ней — вспомогательный символ, ука- 
зывающий, какая конструкция должна следовать 
за этой словоформой; затем (на следующем шаге) 
выдается словоформа, начинающая или составляю- 
щая эту конструкцию, после чего снова следует 
вспомогательный символ очередной конструкции и 
т. д. А-грамматика как бы предсказывает, что может 
следовать за уже выданной словоформой, причем 
глубина предсказания — один соседний символ; каж- 
дый очередной выбор полностью обусловливается 
только одним предшествующим выбором. 

Важно отметить, что из вывода предложения в 
А-грамматике невозможно получить естественное 
представление НС-структуры этого предложения (как 
это делалось для НС- и ВС-грамматик). Строго гово- 
ря, А-грамматики дают некоторую структуру состав- 
ляющих, как и вообще все НС-грамматики, однако 
эти составляющие обычно носят чисто формальный 
характер и не поддаются естественной интерпрета- 
ции. Так, приведенный вывод дает разбиение на 
«составляющие», изображенное ниже. 


а 


аИЯя ии 


АНАЗСИГАЫТТЬ 


РОВ ки ей ив 


_-[-.—- 


| 


. г из 1. 
НЯ О РЖРНИСЬ ВАСЯ ИДЕЯ ПОРТЕР, 757 


Вряд ли можно согласиться с разбиением предло- 
жения на две составляющие — сладкая и все осталь- 
ное, а также с приписыванием категорий полученным 


"Г: 4.5 


КУ 
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составляющим. В предложении Нежность грозит мне 
предательством результат был бы еще хуже: состав- 
ляющей оказалось бы сочетание мне предателъ- 
ством! *). Поэтому интерпретация вывода в А-грам- 
матиках как НС-структуры в общем случае не имеет 
смысла; обычно используется другая интерпретация 
А-вывода: как последовательности предсказаний и 
их реализаций. 

Наконец, отметим, что класс А-языков уже класса 
КС-языков: существуют КС-языки, не порождаемые 
А-грамматиками. Примером может служить язык, 
состоящий из всевозможных цепочек вида а"б"**). 


Завллочительные замечания 


В предшествующем изложении мы еще далеко не 
исчерпали всех возможностей ограничивать классы 
грамматик (в том числе способами, естественными 
с точки зрения лингвистической интерпретации). 
Однако других ограничений мы здесь рассматривать 
не будем; ограничимся тем, что, подводя итог, ука- 
жем иерархию выделенных классов грамматик: 

`произвольные -—> неукорачивающие -—> НС-грам- 
матики — ИС-грамматики —> бинарные ИС-грамма- 
тики — автоматные грамматики. 

Этим шести классам грамматик соответствует 
всего четыре класса порождаемых языков: 

рекурсивно-перечислимые —> НС-языки > ЕС- 
языки > А-языки (поскольку неукорачивающие и 
НС-грамматики порождают одни и те же языки; 
аналогично, КС-грамматики и бинарные КС-грам- 
матики). 

Так как рекурсивно-перечислимые языки — это 
класс слишком широкий и не представляющий линг- 
вистического интереса, то ниже рассматриваются 
только три последующих класса, т. е. НОС-языки, 


*) Данное предложение не порождается грамматикой Го, 
однако читателю будет нетрудно дополнить ее так, чтобы оно 
порождалось (достаточно добавить два правила). 

**) Напомним, что языки {а Пап} и {а"Пс"} не являются 
КС-языками; ср. стр. 65. 
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КС-языки и А-языки, а также соответствующие грам- 
матики. 

У читателя мог возникнуть вопрос: почему ока- 
зывается полезным вводить все новые и новые огра- 
ничения на рассматриваемые грамматики, получая 
все более и более узкие их классы? Это не что иное, 
как широко принятый в самых разных науках методо- 
логический прием: при описании сложного круга яв- 
лений сознательно ограничивать набор используе- 

АВ мых средств описания, рассматривая и такие сред- 
ства, которые представляются в общем случае за- 
ведомо недостаточными. Исследование может начи- 
наться с самыми минимальными средствами; всякий 
раз, когда их оказывается недостаточно, постепенно 
вводятся (и притом возможно более мелкими пор- 
циями) новые средства; благодаря этому удается 
точно определить, какими средствами можно/нельзя 
обойтись при описании того или иного явления, 
а тем самым — лучше понять его природу. До появ- 
ления математических моделей языка подобный под- 
ход был в общем чужд лингвистике. Его последова- 
тельным внедрением она обязана в первую очередь 
излагаемой теории грамматик, равно как и матема- 
тической лингвистике в целом. 


$ 4. Порождбающие грамматики 
и естественные языки 


Теперь мы сделаем некоторые замечания о воз- 
можностях описания естественных языков посред- 
ством порождающих грамматик. При этом, следуя 
только что указанному принципу, мы начнем с са- 
мого узкого их класса — с автоматных грамматик. 

Вопрос о соотношении формальных порождаю- 
щих грамматик и естественных языков безусловно 
является с точки зрения лингвиста исключительно 
важным и интересным; математика, занимающегося 
теорией формальных грамматик, этот вопрос вол- 
нует ничуть не меньше — ведь как раз в естественных 
языках он должен искать главную содержательную 
интерпретацию своей теории, а убедительная ин- 
терпретация не только повышает «внешнюю» цен- 
ность теории, но и служит источником новых идей 
и методов внутри самой теории. 

Однако указанный вопрос весьма сложен и пока 
что сравнительно мало исследован. Поэтому мы не 
сможем предложить читателю связного изложения 
четких результатов, относящихся к описанию кон- 
кретных языков с помощью порождающих грамматик 
того или иного класса. Нам придется ограничиться 
отдельными соображениями общего характера и не- 
многочисленными известными фактами. 


Возможности описания естественных 
языков с помощью А-грамматик 


Для А-грамматики характерно прежде всего, что 
она, во-первых, порождает фразы строго в одном 
направлении (при нашем определении — слева на- 
право), развертывая их слово за словом, а во-вторых, 
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обладает «короткой памятью» — ровно на один шаг. 
Это означает следующее. Во. фразе нередко бывает 
так, что слова 6 и с, далеко отстоящие друг от друга, 
согласованы в широком смысле этого слова — между 
ними имеется какое-то определенное соответствие. 
В КС-грамматике ( и тем более в НС-грамматике) 
это учитывается простым и естественным образом: 
достаточно, чтобы слова в и с или их предки появля- 
лись вместе, на одном шаге вывода, как непосред- 
ственные потомки одного и того же символа. Именно 
в этот момент им и приписывается информация 
о наличии соответствия; после этого между ними мо- 
жет быть вставлено сколько угодно других симво- 
лов — информация о соответствии все равно сох- 
ранится. Так, в грамматике Г, ‚предки подлежаще- 


го и личного глагола (символы 5х, у, им И Уу наст, 0) 
появляются одновременно как потомки символа 
ПРЕДЛ при применении правила Г; их согласова- 
ние в числе и лице (у, и) сохраняется до конца вы- 
вода, что бы ни было вставлено между ними. Таким 
образом, информация о согласовании слов В ис 
«помнится» при любом расстоянии между ними. 
В этом смысле можно сказать, что КС-грамматики 
имеют неограниченную память. Что же касается 
А-грамматик, то они в том же самом смысле имеют 
ограниченную память. Дело в том, что А-грамматика 
способна передавать информацию о соответствии 
только от непосредственно предшествующего симво- 
ла к непосредственно следующему: например, в пра- 
вилах 4 и 5 грамматики Г, (стр. 70) информация 
о числе (индекс у) передается от подлежащего к не- 
посредственно следующему за ним сказуемому. По- 
этому если информацию о соответствии между бис 
приходится передавать через какие-либо промежу- 
точные символы, то в А-грамматике это можно сделать 
только, приписав указания о наличии соответствия 
всем промежуточным символам, для которых эти 
указания по существу не нужны. Так, если мы захо- 
тим порождать с помощью А-грамматики русские 
фразы, где подлежащее отделяется от личного глагола 
какими-либо словами, например существительным 
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в родительном падеже (нежность взглядов грозит 
предательством), нам придется ввести специальные 
правила, где глагол формально будет согласовывать- 
ся с непосредственно предшествующим ему существи- 
тельным в родительном падеже. Однако такое согла- 
сование будет выполняться не на основе собственных 
признаков этого существительного, а на основе ис- 
кусственных «несобственных» признаков, содержа- 
тельно означающих число (и род) подлежащего — 
ведь по сути именно с ним и должен согласовываться 
глагол. Это означает, что вместо каждого символа 
5х, у, род Надо будет ввести шесть новых символов: 
х, у, род | м, ед» Эх, у, род| м, мно. Т. ©.  «существи- 
тельное рода х, в числе у, в род. пад., зависящее от 
подлежащего муж. рода в ед. числе», «существитель- 
ное рода х, в числе у, в род. пад., зависящее от под- 
лежащего муж. рода во мн. числе» и т. д. Аналогично 
придется поступить и в случае, когда подлежащее 
и сказуемое разделяются] наречиями, папример, 
Нежность взгляда сурово грозит мне: здесь надо 
будет ввести специальные категории наречий, а 
именно: 1) наречия, зависящие от глагола, согласо- 
ванного с подлежащим муж. рода в ед. числе, 2) 
наречия, зависящие от глагола, согласованного с под- 
лежащим муж. рода во мн. числе, ит. д. 

Более того, если подлежащее и сказуемое разде- 
лены одним или несколькими придаточными предло- 
жениями, то каждая из категорий, встречающихся 
в этих предложениях, должна быть расщеплена на 
шесть категорий, и, стало быть, все правила порож- 
дения придаточных предложений должны быть фак- 
тически повторены шесть раз. Разумеется, все 
сказанное сохраняет силу и для тех случаев, когда 
подлежащее и сказуемое разделены многими слова- 
ми, например, сколь угодно длинной цепочкой род. 
падежей или любым числом придаточных предложе- 
ний. Таким образом, хотя А-грамматика, как и КС- 
грамматика, способна обеспечивать согласование ме- 
жду сколь угодно далеко отстоящими словами: 


9... а’ однако это делается громоздким и, 
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главное, весьма ибестественным способом: прихо- 
дится вводить много дополнительных категории 
(классов слов), явно противоречащих языковой 
интуиции. 

Но это еще не все. Если приходится иметь дело 
не с одной, а со многими согласованными парами, 
причем каждая следующая «вложена» в предыдущую 
и число таких пар теоретически не ограничено: 


2 ЕЕ ‚ то обеспечить согласование 


р2@.: 2 

в подобной ситуации А-грамматика принципиально 
не способна. Этот факт может быть строго доказан 
(см., например, Гладкий 1966, стр. 103, замечание 
о языке Г); излагать самого доказательства мы не 
будем, а ограничимся содержательными замечания- 
ми, поясняющими, почему это так. Как мы уже ви- 
дели, для обеспечения согласования одной пары 
приходится расщепить все категории, разделяющие 
эту пару; в нашем примере с подлежащим и сказуе- 
мым число категорий ушестерялось. Если же между 
согласуемыми словами имеется еще одна согласуе- 


к. 
мая пара п м... д’ а’, +Токаждую изуже расщеп- 


ленных промежуточных категорий надо будет рас- 
щепить еще раз, что снова увеличит число категорий 
(каждая категория, встречающаяся между ви Ё, 
должна будет нести указания о согласовании как 
а са’, так ибсЬ’). Следовательно, если число вложен- 
ных пар потенциально ничем не ограничено, то для 
обеспечения согласования нужно было бы иметь 
бесконечно много категорий (вспомогательных сим- 
волов) — тогда как число символов в любой грамма- 
тике конечно. Таким образом, указанная ситуация 
А-грамматикой описываться не может. 

Между тем эта ситуация достаточно типична для 


естественных языков. Так, она имеет место в слож- 

а |) 
ных предложениях вроде: Человек, которому гости, 
с а а 


га 


собравшиеся, когда хозяин, который ..., встал, 
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с’ ь’ 
танцевать в соседней комнате, испортили Ебстюм, 


а 
ушел домой (на место многоточия можно вставить 
любые предложения, в том числе содержащие много 
придаточных, также с последовательным вложе- 
нием). Подобные предложения регулярно встреча- 
ются в самых разных языках. Примеры потенциаль- 
но неограниченного вложения согласуемых пар мож- 
но указать и для простых предложений. Таковы, 
например, русские конструкции с последовательным 
вложением препозитивных причастных оборотов 


(например, ... для расставшейся [ разыскивающим 


влюбленного ‚8 эту чарующую всет девушку человека 
ъ’ 
писателем жены...) или пар однородных существи- 


тельных, согласованных в падеже (от, леммы тре- 
а |) с 

буется эквивалентность теореме о компактности 
а’ 


отрезков и квадратов, или о А- компактности, но не 
[1 а’ 

утверждению 4377, а также простоти ), или кон- 

струкции типа 5’ 4е 5” 4е 5’”... А"А"А’ во фран- 


цузском и других романских языках (... спел, а 


с’ 
тайгезве Фип  тетвте 4е бое ГАприл5Идие ептвитё 
а 
септоуёе 4... Известны также еще два примера непри- 
менимости А-грамматик (в этих случаях непримени- 
мы и ИС-грамматики, см. ниже, стр. 92 и сл.), отно- 
сящиеся, впрочем, к весьма ограниченным по рас- 
пространенности явлениям. Что же касается только 
что приведенных примеров, то, хотя круг языков, 
в которых допустимы подобные конструкции, вероят- 
но, ограничен, они все же представляются вполне 
типичными, так что полностью отвлечься от них, 
по-видимому, нельзя. Поэтому приходится признать, 
что построить полное описание естественного 


*) На конструкции обоих указанных типов обратил вни- 
мание авторов Ф. А. Дрейзин. 
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языка на основе только А-грамматик невозможно. 
Строго говоря, это означает следующее: либо по- 
строенная нами А-грамматика не будет порождать 
некоторых правильных фраз (в частности, фраз вида 
абса ... а’с’6’а’, см. выше), либо, если мы сделаем 
ее способной порождать любую правильную фразу 
(а это всегда возможно!), то она обязательно начнет 
порождать и некоторые неправильные фразы (на- 
пример, наряду с фразой абса...Ф’с'6’а’ она будет 
порождать и фразу абса ... с‘а’а’6’ — с нарушенным 
согласованием). 

В дальнейшем, когда речь идет о невозможности 
описать язык с помощью той или иной грамматики, 

(Е везде имеется в виду именно это — либо грамматика 
не порождает некоторых правильных фраз достаточ- 
но обычного и распространенного типа (т. е. является 
неполной), либо обязательно порождает помимо всех 
правильных фраз и некоторые неправильные (т. е. 
является неадекватной). 

Однако то, что А-грамматики недостаточны для 
описания естественного языка во всем объеме, еще 
не исключает возможности описывать с помощью 
А-грамматик те или иные фрагменты естест- 
венного языка. При этом можно, как кажется, пред- 
полагать, что в естественном языке «А-фрагмент», 
как правило, покрывает главную часть. В самом деле, 
конструкции с неограниченным вложением согла- 
сусмых пар немногочисленны, а конструкции 
типа указанных на стр. 92 к тому жееще и 
периферийны. Тем самым А-грамматики в прин- 
ципе способны описывать достаточно  сущест- 
венную часть множества предложений (про- 
стых и сложных) естественного языка. Кроме того, 
А-грамматики могут описывать и другие языковые 
объекты: например, словосочетания (см. ниже, на 
стр. 81—83, описание элементарных именных групп), 
словоформы, слоги. Разумеется, изсказанного вовсе 
не следует, что во всех тех случаях, когда А-грамма- 
тики применимы, они описывают свой объект есте- 
ственным образом, т.е. что они всегда удобны. Более 
того, из изложения на стр. 75 — 76 видно, что это 
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не так. Однако любая грамматика, специально при- 
способленная для естественного описания какого- 
либо А-фрагмента языка (скажем, для описания 
простых предложений, не содержащих конструкций 
вроде указанных выше), будет эквивалентна неко- 
торой А-грамматике. А так как грамматики, экви- 
валентные А-грамматикам (хотя и не являющиеся 
таковыми), сбычно в каком-то отношении — либо 
по характеру правил, либо по характеру выводов — 
характеризуются приблизительно такой же сте- 
пенью простоты, что и сами А-грамматики, то тем 
самым мы получаем как бы эталон простоты. Созда- 
вая грамматику, описывающую простые предложе- 
ния, мы должны стремиться к тому, чтобы она хотя бы 
в одном из указанных отношений не была намного 
сложнее, чем А-грамматика. (Напомним, что «про- 
стоту» следует понимать в логическом, а не в быто- 
вом смысле! — сноска на стр. 25.) Ср. ниже, на стр. 
99 и 103, примеры грамматик с ограниченной памятью 
и «левоправых» грамматик. 

Что же касается вопроса о том, где именно 
А-грамматики оказываются не только применимыми, 
но и естественными, то в целом он до сих пор остается 
малоисследованным, и его выяснение представляет 
большой интерес. В предварительном порядке мож- 
но, по-видимому, считать, что А-грамматики в до- 
статочной степени удобны при описании элементар- 
ных именных групи *) типа или не только из всех 
этих трех наишх первых огромных трехарочных 
металлических железнодорожных мостов (здесь при- 
веден пример максимальной «схемы» элементарной 
именной группы — ЭЙГ; в действительности такие 
группы обычно выступают в более простом виде — 
те или иные места могут быть не заполнены). 

Приведем пример А-грамматики Г., порождаю- 
щей любые ЭИГ указанного типа (с неодушевл. 5). 


*) Под элементарной именной группой здесь понимается 
существительное со всеми его препозитивными согласованны- 
ми определениями, а также предлогом, (ограничительными) 
частицами и вводящим всю группу сочинительным союзом, 
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Схема грамматики Гз 
Т. или 


и 
ЭИГ -> { либо } ЭИГ! 


А 
Как и выше (стр. 41), Л — пустая цепочка; содер- 


я‹ательно наличие Л означает, что соответствующее 
место в ЭИЙГ может остаться незаполненным. 


И. ни 
не 
не только 
отнюдь не 


ЭИГ! > блишь ЭИГ? 
только 
хотя бы 
А 
ГИ. 1 


из 
ЭИГ? -» | [а | ог? 


х, 9), дат 
6. ЭИГ?-» ЭИГз, „; 
ТУ. весь, у, 
каждый. у ла 
ЗИГ®,,, 2” какой-либох, у, и: 
У атот.,. у, 2 
тотх, у, г 5 
ЗИ“, у, 2” этот же самый; у: ИГ, у, 2 
ИЕ №’: 
УТ. одинх ух 
1. ЭИГВ, у: ЗИГ,, у, 2 
А 
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ЭИГз 


два. , 


6 
х, у, 2” \ три» иг х, ед, род 
четы ре? 


Здесь 2 = им, вин 


пять, 


шесть, 


ЭНГ, у... :. ЭГ, мн, род 


тысяча девять- 
сот шестьдесят, 
шесть, 


Здесь 2 —= им, вин 


два, , 


пять: 
_> д шесть: ЭИГ8 


тысяча девять- 
сот шестьдесят 
шесть, 


Здесь 2 = им, вин 


УП. МОйЙх, у, 2 
тв0йх, у, 2 
ЭИГв;, уу... ?}ЭИГ", у, 2 
их 
А 
УПТ. первыйх, у, 
зто ройх, 2 
уе Биге 
7 тысяча девятьсот х, 1,2 
ЭИгГ ха > АА, 
шестьдесят шес- (1<1<Р) 
тойх, т, 
Л 
1Х. ЭИГ „а, у: ЭИГЯ у, (1(</<1<Р 
Обозначение 4х, ,,‚ разъясняется в примечании после 
грамматики. 
Х. Зиг" > 9х, у, 2 _ 


\, 1, 2 


< 


А-грамматики и естественные языки 83 
Е о И С м. жа 


ХТ. 1. мосту, : 


5 _» |Н0бу, + 
саквояжу, + 


2: Река, 
т губау, › 
9 сумкау, › 
3. озеро, + 
5 Ут0у, 2 


> 
ср, у, 2 
р, у ведроу, г 


. 


Примечание к правилу ГХ. Символ ай использо- 
ван здесь для обозначения конкретных прилагатель- 
ных 1-го класса, причем к одному классу относятся 
прилагательные, занимающие одну и ту ке пози- 
цию по отношению к определяемому  существи- 
тельному, а неравенство # > ] означает, что прила- 
гательное 1-го класса должно стоять дальше от 
существительного, чем прилагательное }1-го класса. 
Например, прилагательное французский (английский, 
советский,...) имеет индекс класса меньший, чем 
у прилагательного интересный (новый, ценный, ...), 
поскольку выражение интересные французские жур- 
налы обычнее, чем французские интересные журналы. 
Число таких классов прилагательных обозначено 
через р. 

Таким образом, к грамматике Г. должен быть 
приложен список прилагательных, снабженных ин- 
дексами класса в определенном здесь смысле. Для 
нашего примера мы возьмем небольшой словарь, со- 
держащий прилагательные пяти классов (см. стр. 84). 

Данное разбиение выполнено исключительно в 
иллюстративных целях и отражает действительную 
картину весьма огрубленно: законы взаимного раз- 
мещения прилагательных в действительности не 
укладываются в рамки линейного упорядочения; 
кроме того, порядок прилагательных зависит на 
самом деле от логического акцента (актуального 
членения» словосочетания) — так, интересная 
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1-й класс 2-й класс 3-й класс |4-й класс 5-й ‘класс 
политичес- | стальной немецкий белый хороший 
кий 
музыкаль- | бумажный | сомалий- синий негодный 
ный ский 
литера- деревянный | чешский желтый | замечатель- 
турный ный 
математи-| костяной грузинский | розовый | интересный 
ческий 
химический | виноград- норвежский | черный | отличный 


ный 


математическая книга — ‘имеется математическая 
книга, она интересна’, тогда как математическая 
интересная книга — ‘имеется интересная книга, 
она по математике’. Аналогичным образом, в линг- 
вистической работе, посвященной именным конструк- 
циям некоторого языка, речь может идти об опреде- 
лительных именных конструкциях, субъектных 
именных коиструкциях и т. п., а в работе об опреде- 
лительных конструкциях мы встретимся скорее с 
именными определительными конструкциями, гла- 
гольными определительными конструкциями и т. п. 
При описании таких случаев мы имеем в виду наи- 
более нейтральный, «обычный» порядок. 
Приведем пример вывода в граммати- 
ке Г.: 
ЭИГ 
(Г] и ИГ! 
П) и хотя бы ЗИГ? 

и хотя бы с ЭИГ?, вн, твор 

и хотя бы с ЭИГ“,,, мы, твор 

и хотя бы с ЭИЙГ?,, ми, твор 
(УГ.4) и хотя бы с девятью ЭИГвь, вн, твор 

и 

и 

и 


хотя бы сдевятью нашими ЭИГ" и, мн, твор 
хотя бы сдевятью нашими ЭИГ®5 к, ив, твор 
хотя бы с девятью нашими отличными 


к, ми, твор 


= 
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(1Х) и хотя бы с девятью нашими отличными 

бумажными ЭИГ*„, ин, твор 

(Х) и хотя бы с девятью нашими отличными 

бумажными ©’, мн, твор 
(ХТ.2) и хотя бы с девятью нашими отличными 
бумажными сумками. 

(Еще раз позволим себе заметить, что для чита- 
теля будет весьма полезно поупражняться в само- 
стоятельном построении выводов. Это относится, 
конечно, также ко всем предыдущим и последующим 
примерам грамматик.) 

Обратим внимание на то, что составляющие, ко- 
торые получаются из приведенного вывода способом, 
описанным на стр. 61, оказываются в данном случае 
вполне естественными (в отличие от грамматики Г.), 
см. рис. на стр. 86. Это объясняется особенностями 
синтаксического строения элементарных именных 
групп в русском языке — ЭЙГ строятся по схеме 


... (# (8 С (е (а (с (6 (а))))))))..., 


т. е. все элементы, распространяющие главный эле- 
мент (а), находятся влево от него, и каждый из них 
относится (определяет или подчиняет) сразу ко всему, 
что стоит вслед за ним; при этом любой элемент, 
кроме главного (т. е. последнего), может отсутство- 
вать. Встречающиеся в выводе вспомогательные 
символы — ЭИГ!, ЭИГ?, ... — естественно интерпре- 
тируются как обозначения для «неполных» ЭЙГ, т. е. 
как типы составляющих: ЭЙГ{ — именная группа 
без союза, ЭЙИГ? — именная группа без союза и без 
ограничительной (отрицательной) частицы, ЭЙГЗ — 
именная группа без союза, без ограничительной 
(отрицательной) частицы и без предлога, и т. п. 
Вообще, А-грамматики в некотором отношении 
удобны для описания именно тех языковых объектов, 
которые имеют указанную схему строения, т. е. 
«наращиваются» только с одной стороны. Такими 
объектами, например, являются агглютинативно по- 
строенные словоформы — вроде таких, как русские 


(((((((послед)ова)тель)н)ост)н)ьий) 
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В 


5 


рии | 


_ 


ИР ПИН) 


7 ПИРИ 
7 „” 
а: 
2-0. ИР 
мч 7 
2 И и 
2-8 © 
Я МИР 


Е. 


НИНОЙ РНИИ) ИРА) ИНИЯЙ) 9) ИР) И) 


ОРИОН, 


ий МА Ри 
рн. 74 
‚А и 
7: `` ра 
ДИР 
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или  (((((((предсказуу)дем)ост)н)ост)ь), ср. также 
(((((цел)у)ющ»его)ся) и т. п. (в языках типа турец- 
кого или венгерского подобные формы носят несрав- 
ненно более регулярный характер). 

Разумеется, для описания объектов, растущих 
вправо, более естественны А-грамматики не совсем 
такие, как определенные на стр. 69, а именно: в этом 
определении следует заменить правила вида 4 — 6Б 
правилами вида А ->» БЬ, т. е. перейти от левосто- 
ронних А-грамматик к правосторонним. 

В заключение разъясним, что понимается под 
удобством применения А-грамматик для описания 
языковых объектов вида ((((@)Ь)с)а)... — так сказать, 
«слоистых» объектов. А-грамматики хороши здесь 
именно потому, что эта слоистость в явной форме 
вскрывается А-выводом соответствующего объекта 
(это и есть то самое «некоторое отношение», о котором 
говорилось на стр. 85). Однако в других аспек- 
тах А-грамматики могут ине быть удобными при 
описании даже таких объектов, например, для отра- 
жения всех морфонологических процессов, сопровож- 
дающих порождение словоформ. В таких случаях, 
по-видимому, окажется целесообразным расчленять 
соответствующие явления на разные уровни и опи- 
сывать их несколькими грамматиками, одна из ко- 
торых будет автоматной (например, А-грамматике 
может быть поручено порождение словоформ на 
уровне морфем и, может быть, морф, тогда как даль- 
нейшая реализация полученной цепочки выполня- 
ется грамматиками других типов). 

Теперь мы перейдем к рассмотрению контекстно- 
свободных (ИС)-грамматик. 
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Наиболее характерной особенностью ИКС-грам- 
матик является тот факт, что на каждом шаге вывода 
«обрабатывается» ровно один символ, т. е. ни- 
каким образом не может быть учтено наличие/от- 
сутствие или свойства различных соседних символов. 
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Это может создать впечатление, что ЕКС-грамма- 
тики мало пригодны для описания естественных 
языков: ведь в обычных грамматиках утверждения 
о выборе тех или иных форм, о варьировании или 
развертывании тех или иных элементов высказыва- 
ния, как правило, формулируются именно с учетом 
контекстных условий. Так, при описании флективных 
форм указывается, какая флексия должна быть вы- 
брана в зависимости от типа основы (который, таким 
образом, выступает как контекст); при описании 
употребления русских падежей указывается, что 
винительный падеж прямого дополнения заменяется 
родительным при наличии отрицания (и некоторых 
других, более сложных условий); творительный 
субъекта возможен при отглагольном существитель- 
ном только в том случае, если при этом существи- 
тельном есть дополнение в родительном падеже 
(рассмотрение вопроса советом, но не *рассмотрение 
советом) и т. д. Однако даже А-грамматика (весьма 
частный случай КС-грамматики!), как мы видели, 
практически способна порождать подавляющее боль- 
шинство простых и сложных предложений естествен- 
ного языка. Тем более это должно быть верно для 
произвольных ИС-грамматик. В самом деле, оказы- 
вается, что почти во всех случаях, где использование 
контекста на первый взгляд представляется неиз- 
бежным, фактически без него в принципе можно 
обойтись. В самых общих чертах это делается так: 
пусть имеется класс элементов Х, причем в соседстве 
с элементами некоторого класса У элементы Х ведут, 
себя иначе, чем в соседстве с элементами класса #7, 
так что, например, имеют место правила: 

1. УХ -> УАВ 

2. #Х —> 2СР (эти правила используют контекст). 

Можно, однако, ввести два новых символа Х. и 
Х, и обозначить через Х, элемент Х в позиции после 
У, а через Х, — элемент Х в позиции после &. Тогда 
обычно удается перейти к правилам, не использую- 
щим контекста: 

1’. Х,! —>> АБ, 

2’, Х.-> СО, 
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Другими словами, вводятся более дробные категории 
элементов, учитывающие их позиции в контексте. 
Покажем, каким образом может быть выполнен 
переход к контекстно-свободным формулировкам в 
приведенных выше примерах обращения к контек- 
сту. Слева помещается нужный фрагмент соответ- 
ствующей контекстно-связанной грамматики, спра- 
ва — эквивалентный фрагмент, состоящий из кон- 
тексгно-свободных правил. 


а) Выбор флексии падежа в зависимости от типа 
г сновы: 


Сфын, род —> 0: Флык, род Сфын, род > 0* Флён, род 
О! Флин, род — ОТ 06 (штан-0в) Флин. род —> 06 
0? Флин, род —> О? (брюк-) Флин, род—> А. 
03 Флын, род —> ОЗ ей (плащ-ей) Флйн, род-—> ей 


где Сф — словоформа, О — основа типа # (1 = 
= 1, 2, 3, ...), Флинрод — флексия род. падежа 
мн. числа. 


6) Выбор падежа прямого дополнения в зависи- 
мости от наличия отрицания: 


й-> У"ОБ ат 7 Угорь 
Т-> Ме "ОБ ах Я > Мег У"ОБл 
ХУГОб ах — ХУ ин Оба — Эвии 


[Х == №ев] ОБраь —> брод 


(мальчик читает журнал) 


М№е2У "ОБлаш — М№евУ род 
(мальчик не читает журнала) 


где 7 — группа глагола, У — переходный гла- 
гол, Оба — прямое дополнение, 5 — группа. су- 
ществительного, Мер — отрицание. 

в) Возможность творительного субъекта при 
отглагольном существительном в зависимости от 
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МЫ— 


наличия объекта (рассмотрение вопроса советом): 


$->59'067 5иб7 $508 библ 
995 и6] 9-5 5иь р 
ОВ5биб; —> 06} Энвер 5иБ 7! > Звор 


(06) — объект, 5и6] — субъект). 


Во всех этих трех содержательно весьма различ- 
ных примерах применен в точности один и тот же 
формальный прием: информация о контексте «за- 
гоняется» в новые категории. Таким образом, чем 
меньше мы хотим использовать контекст, тем больше 
категорий приходится ввести, и обратно. Привле- 
кательность перехода к контекстно-свободным пра- 
вилам состоит в том, что оценить степень сложности 
разнообразных и содержательно пестрых обращений 
к контексту очень трудно, тогда как в КС-правилах 
«мерой» степени сложности становится просто число 
используемых категорий. Что касается лингвисти- 
ческой осмысленности такого перехода, то в ряде 
случаев введение новых категорий с отказом от ис- 
пользования контекста оказывается оправданным, 
а в других случаях может представляться искусст- 
венным приемом. Однако же и здесь переход к кон- 
текстно-свободным правилам может быть полезен — 
уже хотя бы тем, что заставляет четко поставить во- 
прос о содержательной целесообразности использо- 
вания контекста в конкретных ситуациях. 

Итак, как уже было отмечено, почти во всех 

А случаях контекст может быть элиминирован. Тем 
не менее есть случаи, когда это не так. В частности, 
от контекста нельзя отказаться, т. е. невозможно 
обойтись одним символом в левой части правила, 
если правило должно обеспечивать перестановку 
символов: ведь перестановка по своему существу 
является многоместной операцией. Стало быть, 
КС-грамматика не может породить язык, содержащий 
цепочки, которые не могут быть построены без при- 
менения перестановок. Рассмотрим „например, язык,со- 
держащий всевозможные цепочки вида 4,4.а34а’1 а’. а’з, 
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азалаза ,дазалазаз, алазазадалазаьал и т. п. (в общем 
виде такие цепочки можно записывать как хат’) 
и не содержащий никаких других цепочек. Содержа- 


тельно 4, и @1, а) иа. ит. д. могут пониматься как 
пары элементов, определенным образом «согласо- 
ванных» между собой *). Этот язык легко может быть 
порожден грамматикой, содержащей правила пере- 
становки, например следующей **): 


1. 1 ГА, 
=. 4; > А 1 ]=1,2, 3 
3. ГА; —а.1, 
АА Г -0, 
(а, а: 9 — основные символы; 1, А, — вспомога- 


тельные символы; Г — начальный символ). | 
Покажем для примера, как можно вывести в этой 


В ОКО 


грамматике цепочку а.а.а:аздагалалаз: 


(1) ГАзаз 

(1) ГАа, Азаз 

(1) ГА1а\ Ала Азаз 

(1) ГА.а- Ала. Аза. Азаз 

(2) ГА, Аза-а1 Аза Азаз 
(2; 5 раз) ГА» А. А „ Азазалалаз 

(3) 451 А: А „Аза-алалаз 
(3; 3 рава) дла Газанола; 

(4) азалазадазалалаз 


*) Строго говоря, здесь речь идет не о самих символах 

а, а, ит. д., а об их соответствующих вхождениях в це- 
почки. , , 

са **) В соответствии с теоремой Т, | о(стр. 479) для этой грам- 


7 матики существует эквивалентная НС-грамматика (которую 

/ читатель без труда построит сам, пользуясь методом модели- 
рования ‚перестановок ПС -правилами, указанным в сноске 
к стр. 54). пя 
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В то же время известно, что язык {2545'} не может 
быть порожден никакой ИС-грамматикой. Строгое 
доказательство этого факта, см., например, Гладкий 
1966, стр. 91. 

Оказывается, что указанное явление встречается 
и в естественных языках, т. е. в них возможны фраг- 
менты, состоящие из цепочек вида 202’. 

В литературе описаны два примера такого рода: 

1) Конструкции типа: 


а а’ 
Мими, Перепетуя, Грилиа, ета — двоечник, 
ЕЕ: троечник, Е ... соответ- 
ственно. 


Здесь роль х (а6с4...) играет цепочка собственных 
имен, а роль 2’(а’6’с'а’...) — цепочка характери- 
стик, которые должны быть согласованы с этими име- 
нами в роде *); а — это тире (точнее, связка «быть 
в нулевом выражении). 

2) В индейском языке мохавк, как указывает 
П. Постал (Роза! 1964), широко распространены 
предложения, в которых основное дополнение дуб- 
лируется инкорпорированием соответствующих основ 
в глагол-сказуемое: Девушка книго-читает книгу. 
Кроме того, любой глагол (в том числе включающий 
инкорпорированные дополнения) легко субстанти- 
вируется и приобретает способность выступать в роли 
дополнения, в частности, инкорпорироваться в ска- 
зуемое: Я книгочтение -интересуюсь книгочте- 
нием (т. е. ‘я интересуюсь чтением книги’). Этот 
процесс теоретически может быть повторен неогра- 
ниченное число раз: Вы книгочтениеинтересо- 


думаете о книгочтениеинтересе (‘вы думе о иН- 


а 
п ь 


тересе к чтению книги’), Они книгочтениеинтересо- 
Ге ь’ с’ 

———— а А А Е 

думание - видят книгочтениеинтересодумание (‘они 


видят думание об интересе к чтению книги’) ит. д. 


*) Аналогичный пример был впервые указан И. Бар- 
Хилледом и 9. Шамиром (Ваг-НШе] — Звапиг 1960). 
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Здесь 1’ (= а’6’с’а’) — это дополнение, х (= абса) — 
его дубликат, инкорпорированный в сказуемое, 
а < — собственно сказуемое. Подчеркнем, что та- 
кая конструкция является правильной лишь тогда, 
когда инкорпорированный дубликат дополнения 
в точности соответствует самому дополнению по со- 
ставу и порядку следования основ. 

Если учитывать эти примеры, то приходится при- 
знать, что, вообще говоря, КС-грамматик недоста- 
точно для описания любых естественных языков 
в полном объеме. Однако сразу видно, что оба 
примера носят периферийный характер: первая кон- 
струкция, хотя и допустима, вероятно, в любом 
языке, крайне специфична и не относится к числу 
употребительных, а вторая, имеющая очень общее 
значение и, по-видимому, достаточно употреби- 
тельная, известна только в одном малораспростра- 
ненном языке. Поэтому при всей теоретической цен- 
ности этих примеров ими можно пренебречь. Если же 
от них отвлечься, то КС-грамматики можно считать 
в принципе достаточным средством для описа- 
ния естественных языков. Это утверждение, разу- 
меется, не может быть строго доказано; убеждение 
в его истинности основывается на ряде следующих 
эмпирических соображений. 

1) Существуют так называемые категориальные 
грамматики, относящиеся к распознающим грамма- 
тикам (см. стр. 122 и сл.). Эти грамматики разраба- 
тывались и применялись к естественным языкам не- 
зависимо от ИС-грамматик, причем примеров их не- 
адекватности (за исключением двух, указанных выше) 
до сих пор приведено не было. Однако доказано (см. 
ниже, стр. 133), что класс языков, описываемых 
категориальными грамматиками, совпадает с классом 
КС-языков. 

2) Сравнительно недавно для описания языков 
были предложены автоматы с магазинной памятью *), 
способные осуществлять как распознавание, так и 
порождение. Н. Хомским было доказано (см. стр. 


*) О них пойдет речь на стр. 136 и сл. 


94 $ 4. Естественные языки 


149), что все языки, обрабатываемые такими автома- 
тами, суть КС-языки, и обратно. Таким образом, 
оказалось, что еще одна формальная модель есте- 
ственного языка, введенная из независимых сообра- 
жений и не встретившая существенных принципи- 
альных трудностей, эквивалентна ИС-грамматике. 

3) В рамках того раздела математической линг- 
вистики, который можно называть моделированием 
лингвистических исследований (см. ниже, стр. 162 
и сл.), легко выделяется класс так называемых 
конечно-характеризуемых языков (см. стр. 170), 
которые интуитивно очень близки к естественным 
языкам. Оказывается, что все конечно-характери- 
зуемые языки являются ИС-языками (обратное 
неверно!). Это опять-таки склоняет к мысли о том, 
что ВКС-грамматики способны порождать естествен- 
ные языки. 

4) Наконец, известен целый ряд алгоритмов ав- 
томатического анализа и порождения текстов на есте- 
ственных языках, которые (алгоритмы) используют 
в качестве описания соответствующих языков именно 
КС-грамматики или же эквивалентные им системы. 
Многие из этих алгоритмов запрограммированы для 
ЭЦВМ и опробованы в достаточно широких экспери- 
ментах; на ЦС-грамматиках основаны, например, 
алгоритмы синтаксического анализа для нескольких 
языков, разрабатываемые в Техасском универси- 
тете (Тозь 1965), ряд алгоритмов, использующих 
так называемый метод Кока (Науз 1962, 412—414), 
и некоторые другие алгоритмы, упоминаемые в ра- 
боте Вофго\у 1963; ср. также Упруе 1961 и Арсенть- 
ева 1965. 

Все это и заставляет признать ИС-грамматики 
достаточными для естественных языков. 

В частности, стоит отметить, что конструкции 
типа абс4...Ф’с’В’а’ (стр. 77), не описываемые 
А-грамматиками, легко могут быть порождены с по- 
мощью ИсС-грамматик. Так, легко показать, что язык, 
состоящий в точности из цепочек указанного вида 


(составленных из символов 41, 45, аз, @1, а», аз), 
порождается ЕКС-грамматикой, содержащей всего 
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шесть правил: 


РЕ: дю: 


’ 


Г -> а. [аз | 
1— аа: 

Теперь необходимо сделать два следующих важ- 
ных замечания. | | 

Во-первых, сказанное отнюдь не означает, будто 
АС-грамматики порождают только естественные 
языки или языки, близкие к ним: среди КС-языков 
имеются и такие, которые вовсе не похожи по своему 
строению на естественные. 

Во-вторых, из того, что КС-грамматики практиче- 
ски достаточны для описания естественных языков, 
вовсе не следует, что они всегда удобны для этой 
цели, т. е.. что они позволяют описывать любые 
конструкции естественных языков естественным об- 
разом. Более того, хорошо известно, что это не так 
(ср. аналогичное замечание относительно А-грамма- 
тик, стр. 79). ВС-грамматики не обеспечивают, 
например, естественного («имеющего объяснительную 
силу») описания для так называемых непроективных 
конструкций *), т. е. для конструкций с разрывными 
составляющими (или, что то же самое, с пересече- 


:й 


—3 
нием МН, Г" ит. п. или обрамлением ` } 


‚= стрелок синтаксической зависимости). При 


этом непроективные конструкции изобилуют в са- 
мых разных языках: 


| 
‹ 


ег | 


Русск. К этой поездке может пробудить интерес 


—ф 
только выступление директора. 


*) О понятии проективности см. Падучева 19646 и Глад- 
кий 1966, стр. 17 и сл. 
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и 


ри | 
Англ. А ФЛеотет 15 зе имей 4езст фе; те рго- 
региез 0] И; [шпсНоп. 


— < 


—-— 


$ 
Нем. ... Фе Тайзасйе, ааВ @1е Мепзсйеп те Райе- 
= } 
Кей Безизеп, Уетй&Йтиззе 4ег обуекНоеп Вена т Аиз- 
У 
+ 
завет иледетзизревет. | 


+ | 
Фр. ... @ виетте, 4отё 4а Етапсе ропай епсоте 
— | 
4 
(е; Шеззигес... | 
+ г} 


Сербо-хорв. Аезшасйа ргосеза ]е4ап Те о па}- 
затрй оба гевщасие. 


Венг. А РЁводет, Вов Абзедететте! якегай 
Бедзопуцата. 

Если мы хотим описывать строение подобных фраз 
в терминах составляющих (а грамматики, в частно- 
сти ИЁС-грамматики, описывают синтаксическую 
структуру именно так), то для естественного описа- 
ния необходимо использовать разрывные составляю- 
щие: все слова, зависящие от одного и того же слова, 
должны образовывать (вместе с ним) одну составляю- 
щую, а это при отсутствии проективности обяза- 
тельно поведет к появлению разрывных составляю- 
щих (к этой поездке... интерес, а ШФеотет ... иисй 
4езст фе; йе рторегИиез о} #5 рипсНоп и т. д.). Однако 
системы составляющих (НС-структуры), приписы- 
ваемые фразам КС-грамматикой и, более того, любой 
НС-грамматикой, разрывных составляющих содер- 
жать не могут. 

К этой трудности мы еще вернемся ниже, на стр. 
106, а пока рассмотрим два?!специальных случая 
ЕС-грамматик,{ эквивалентных А-грамматикам (как 
это было обещано на стр. 80). 
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т 

Первый случай. В естественных языках 

возмомо размещение зависимых слов справа от 
| у 

главного («правое подчинение»): лист бумаги, ипе 


} у 
гёд{е зртлсе, ше мт, или слева от главного («левое 


| 

подчинение»): белый лист, сейе тавфе, бой адодее. 

Как правое, так и левое подчинение может быть 
последовательным: жена на амёститеня предее 

нь бов 
датедя второй секции эклектики совета по при- 

+ | 
| | + | 

кладной мистике при президиуме Академии наув 

$1 4 + р} | + р 
королевства Мурак и очень быстро бегущий олень. 
В зависимости от языка та или иная конструкция 
с последовательным подчинением вправо или влево 
может быть теоретически неограниченной: такова, 
например, конструкция с последовательным подчи- 
нением родительных падежей в русском языке 
(неограниченное правое подчинение) и аналогичная 
конструкция в литовском (где род всегда ставится 
перед подчиняющим его ‘словом, что приводит к 
неограниченному левому подчинению). Тот факт, что 
языки мира различаются и могут классифицироваться 
по преобладанию в них правого или левого подчи- 
нения и, в частности, в зависимости от возможности 
неограниченного последовательного подчинения в 
ту или иную сторону, был отмечен и исследован 
еще Л. Теньером (Тезтиеге 1959, стр. 32—33). Не- 
давно на эту проблематику—в связи с применением 
ЕС-грамматик для описания естественных языков — 
обратил внимание В. Ингве(Ингве 1965 и Упоуе 1960). 
Он заметил, что существует большое количество 
языков (например, английский, русский, француз- 
ский ит. п.), в которых последовательное правое 
подчинение принципиально не ограничено, а при ле- 
вом подчинении длина цепочки всегда ограничена 


4 А. Гладкий, И. Мельчук 
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в силу структурных особенностей этих языков *). 
Оказывается, что ИЁКС-грамматика, порождающая 
подобный язык, обладает следующим интересным 
свойством: длялюбойвыводимой терминальной цепоч- 
ки имеется такой вывод, в каждой строчке которого 
все вспомогательные символы собираются в правом 
конце, занимая не более чем К последних мест 
(К — константа, фиксированная для данной грам- 
матики, т.е. одна и та же для всех выводов в ней)**), 
Иначе говоря, если каждую строчку вывода раз- 
делить на две части: левую — одни терминальные 
символы до первого вспомогательного символа Х — 
и правую — от Х включительно до конца (в правой 
части могут содержаться и терминальные символы), 
то правая часть всегда будет содержать не более А 
символов. Левая часть содержательно интерпрети- 
руется как уже «выданный» кусок порождаемой це- 
почки (на следующих шагах вывода этот кусок боль- 
ше не подвергается никакой переработке), а правая— 
как рабочий участок, который грамматика должна, 
так сказать, держать в памяти. Таким образом, 
число К есть не что иное, как максимальный объем 
памяти, необходимый для порождения любой це- 
почки в данной грамматике (т. е. найдется цепочка, 
не порождаемая при объеме памяти < К). Это число 
совпадает с максимальной длиной цепочки последо- 
вательных левых подчинений, возможной в рассма- 
*) Мы не будем останавливаться здесь на так называемой 
«гипотезе Ингве» (Ингве 1965), которая представляет собой 
полытку объяснить это эмпирическое наблюдение некоторыми 
общими закономерностями строения человеческой психики. 
_**) Строго говоря, для того чтобы КС-грамматика обла- 
дала указанным своиством, ограниченности последовательно- 
го левого подчинения недостаточно. Необходимо выполнение 


ряда более сильных и сложно формулируемых требований 
(см. Падучева 1967), из которых вытекает, например, огра- 


ниченность правого параллельного подчинения $ *% * 5... 


, > ^ 


и последовательного вложения тлпа [7 ре По это- 
... о о .- 


ы ^ 


му вопросу см. также Шрейдер 1966. 
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триваемом языке: так, если в каком-то языке не бы- 
вает более трех последовательных подчинений влево, 
то при порождении этого языка для любой цепочки 
можно построить такой вывод, в котором не возни- 
кает необходимости запоминать более трех символов 
сразу. Отмеченная связь между допустимой глуби- 
ной левого подчинения и объемом памяти была уста- 
новлена В. Ингве (там же). 

Проиллюстрируем сказанное примером; а именно 
рассмотрим грамматику Г., порождающую некото- 
рые именные группы русского языка, в которых 
правое подчинение не ограничено, а глубина лево- 
го не превосходит двух. 


Схема грамматики Га 


х, у, 2 — хи. х, у’, род 
х, у, :— Ах, 29х, И, 2 
— очень, совершенно, А 
2—7 | весьма, ... % 9, 2 
1, 2 —х, 1, 2 


Ах, у, ‚> Ах, 2 
‚у :->СЫНу г, заместительу, ‚, председательу, г, 
комитету, „,... 
Уж, и, 2 —> ЖЕН@у, ›, СЕКЦИЯу, г,... 
Ах, у, ‚ —> вРасивыйх, у, „ ТОЛСТЫЙх, у, =, 
важныйх, у, в»... 


(Смысл обозначений — см. стр. 55 и 57; три послед- 
ние строчки представляют собой сокращенную за- 
пись, смысл которой очевиден. Какив Г, и Г., 
здесь не учтены особенности согласования А с оду- 
шевленным »ьин.) Приведем пример вывода в грам- 
матике Га: 


5, ед, вин 
Ак, ед, вино к, ед, вин 
очень Аж, сд, вино ж, ед, вин 


очень красивую 5’, ед, вин 
4* 


А 


д.5 
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—> 


очень Ерасивую 9к, ед, вином, ед, род ` 


очень красивую 5, ед, вином, ед, род 
очень красивую жену Ум, ед, рол 


очень красивую жену 5, ед, родэм, ед, род 
очень красивую жену ©, ед, родЭм, ед, род * 
очень красивую жену сына ды, ед, род 


очень красивую женусына заместителя 
председателя 5’, ед, род 


очень красивую женусына заместителя 
председателя секции 


В этом выводе объем памяти равен двум: ни одна 
промежуточная цепочка не содержит более двух 
вспомогательных символов. Ту же цепочку можно 
было бы породить и по-другому, используя боль- 
ший объем памяти, например, сначала получить 


из Юж ед.вин цепочку 


очень Ак, ед, вин ж, ед, вином, ед, родом, ед, род 
5м, ед» род 5, ед, род’ 


а уже из нее нашу терминальную цепочку. Для нас, 
однако, важен необходимый объем памяти, 
т. е. такой, что с меньшим объемом получить данную 
цепочку невозможно. Именно этот объем и равен 
здесь двум. 

Можно доказать, что и любая терминальная це- 
почка, выводимая в Г., может быть порождена с 
объемом памяти < 2. Доказательство (опущенное 
здесь) основано на очень простом соображении: 
«хороший» вывод надо проводить так, чтобы для 
каждого существительного сначала выдавались в 
терминальном виде его левые зависимые, и только 
потом выполнялось развертывание именной груп- 
пы вправо. 

КС-грамматика описанного типа («КС-грамматика 
с ограниченной памятью») всегда эквивалентна не- 
которой автоматной грамматике. Это нетрудно до- 
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казать (идея доказательства, которое мы здесь не 
приводим, заключается в том, что правая часть строч- 
ки вывода, состоящая из А символов, кодируется 
одним новым вспомогательным символом). Таким 
образом, мы видим, что в случае языков с ограничен- 
ной глубиной левого подчинения КС-грамматики с 
ограниченной памятью, эквивалентные А-граммати- 
кам и близкие к ним по построению выводов, т. е. уст- 
роенные гораздо проще, чем произвольные КС-грам- 
матики, оказываются не только принципиально до- 
статочными, но и весьма удобными — они обеспе- 
чивают достаточно естественное описание. 
Второй случай. Бывают, однако, явы- 
ки, в которых неограниченную глубину имеет не 
только правое, но и левое последовательное под- 
чинение. Подобным языком является, например, 
венгерский, где неограниченное левое подчинение 
получается за счет препозитивных распространен- 
ных определений *), а неограниченное правое под- 
чинение — за счет, например, придаточных предло- 
жений с который (ср. Дом, который построил Джек). 


*) См. пример из новеллы Г. Фехера — шуточный тост, 
приведенный в работе Уагра 1964, стр. 70: 

Кобпот, робу эшапипЕ аз авуае ?3 06 Кага? ЕоШ 
Ефошакозт 1 аКагд 20 Косзщегёй 1 тейепб пушогваза1 18 
тевта4ё И уиразакиуа 18 Бипаёрафа 15 Каразгкоаб 1% киЦапсз 13 
ай ПедЕ {6153етё 01 1? @асзеррет М" Коппусзеррьеп 10 5155204й- 
Ет026аб 3 ро 42 Иаз 6 пуё!б1 8 Шититай 7 га бТозавоаг 6 етопб- 
а7&ь01 5 6446 4 саззлевей 3 Койё210$ егеёпек ? Полаза * ё0524- 
гадокта о0552еатЦа аппаё таета)ат, аКёрреп 1а75а 0552е е 
а Ф@тзазавоф аз фаз ззетеёе.— 

Я точу, чтобы настоящая любовь скрепила эту компанию 
так, как на столетия скрепляет материал моста действие 1 
связующей силы ? гвоздей3, торчащих 4 из подъемного моста 8 
разбойничьего феодального замка 8, освещенного? лунным све- 
том 8, отражающимся? в слезинке 18, вытекшей И из выпу- 
ченного глаза клеща 13, вцепившегося 14 в шерсть 1 овчарки 18, 
встревоженной " ужасным скрипом 18 тележных колес 19, 
жаждущих ?0 вырваться. из объятий ?? грязи ?3. Эта фраза— 
не придуманная, а взятая из художественного текста! — 
имеет глубину 22 и является абсолютно правильной с грам- 
матической точки зрения (точно в такой же степени, как и ее 
русский перевод). Более того, ничто пе мептает продолжить 
цепь определений влево а4 ПЫата. 


102 $ 4. Естественные языки 


Для порождения языков с таким свойством можно 
предложить еще один особый тип КС-грамматик, 
в некотором смысле более общий, чем КС-граммати- 
ки с ограниченной памятью, рассмотренные выше. 

Прежде всего сформулируем более точно, какие 
языки мы. имеем здесь в виду. Это языки, в которых 
возможно неограниченное число последовательно 
подчиненных слева направо конструкций Х.Х.... 
... Х.... (неограниченное правое подчинение), и при 
этом в каждой из конструкций Х, возможно неогра- 
ниченное левое подчинение — последовательность 
конструкций.. .Ху...ХьХ и; однако внутри конструк- 
ций Х,; дальнейшее неограниченное развертывание 
невозможно. Применительно к венгерскому языку 
Х, можно понимать как простые предложения, яв- 
ляющиеся каждое (кроме первого) придаточным опре- 
делительным к предыдущему, а Х,; — как препози- 
тивные причастные обороты (ср. пример в сноске на 
стр. 101). 

Представим себе грамматику 


= <Р*, у*, Т*, 5*у, 


основной словарь которой И* состоит из п символов 
А. 4А,,.... А, и правила которой имеют вид 


Х ТА, или Х-—>А,, 


где Х и У принадлежат к 7. *. Поставим в соответ- 
ствие каждому из символов А, некоторую А-грам- 
матику Г* = ‹Р, 7! А,, 5. где 7 — основной 
словарь, общий для всех Ги, р! — вспомо- 
гательный словарь, не содержащий никаких симво- 


лов из 7*и т", кроме 4А;; А, — начальный 
символ; правила схемы 9; имеют вид С->ар или 
С ->с (здесь, как и в других примерах, заглавными 
латинскими буквами обозначаются вспомогатель- 
ные символы, а строчными — основные). При этом 


будем считать, что вспомогательные словари грам- 
я 
матик Г; попарно не пересекаттся. 
Грамматика Г* очень близка к автоматной, 
отличаясь от нее только направлением развертыва- 
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ния*) порождаемой цепочки; в сущности она яв- 
ляется автоматной с точностью до зеркальной сим- 
метрии. Таким образом, мы имеем дело с одной 
«праворазвертывающей» (квази-А-) грамматикой 
и сп «леворазвертывающими» А-грам матиками. 
Рассмотрим теперь объединение всех этих грам- 
матик, точнее, грамматику Г, у которой основной 


= 
словарь — 7 (тот же, что увсех Г;), вспомога- 
тельный словарь — 7. =7* () 7,0 7: |1 7? |... 
... ) Тт (т.е. объединение вспомогательных сло- 


- * % 
варей всех грамматик Г*, Г, ,..., Г, и основного 
словаря грамматики Г*), начальный символ — Т 
(тот же, что у Г*), а схема есть объединение схем 
всех грамматик Г*, Г" Г*,.., Г». Эта грам- 
матика Г представляет собой специальную ЕС- 
грамматику, которую можно назвать К С-грам- 
матикой с независимым двусто- 
ронним развертыванием **). 

Приведем пример (схемы) такой грамматики. 


1-> ВА, Аз > аРз 
В СА, Аз 503 
5+ С-—>ВА. Аз —>СВз 
— С->ЛАз 5. — о > 
р-р А. З— 3-—> 
2-> А. А. -> аз 
Вз —>еВз 
А: -—>6Р, Дз —>а 
Ш Р, ->а0, 
1 | О: >а0: 5 -| Аз —>сРа 
О1->с “| Ра->б 
5, ={ А.->а 


*) Под направлением развертывания здесь понимается 
направление, в котором «выбрасываются» терминальные сим- 
волы, например, С -› ар — левое развертывание. 

**) То, что эта грамматика не является автоматной, оче- 
видно хотя бы потому, что некоторые ее правила (правила 


"ал 
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Грамматика введенного нами типа работает сле- 
дующим образом. Сначала порождаемая цепочка 
неограниченно развертывается слева направо за 
счет символов А, (которые могут интерпретировать- 
ся, например, как синтаксические группы или пред- 
ложения); это делается правилами 5*. Затем любое 
из А, может (правилами 5,) неограниченно развер- 
тываться справа налево — в цепочку терминаль- 
ных символов (которые можно интерпретировать 
как слова). Подобный процесс порождения удобен 
в таких, например, случаях, как венгерские фразы 
рассмотренного выше типа. 

Каждая ЕС-грамматика с независимым двусто- 
ронним развертыванием эквивалентна некоторой 
А-грамматике. Доказательство этого факта мы при- 
водить не будем. 


Использование НС-грамматие 
и неукорачивающих грамматик 
для описания естественных языков 


Как отмечалось выше, НС-грамматики (и равные 
им по порождающей силе неукорачивающие грам- 
матики, см. стр. 54) представляют собой лишь част- 
ный случай общего понятия грамматики. Тем не 
менее, НС-грамматики безусловно достаточны (хотя 
и не обязательно удобны) для описания любых есте- 
ственных языков в полном объеме. Это вытекает из 
следующего практически очевидного допущения: 
любой естественный язык (точнее, множество его 
правильных фраз) есть легко распознаваемое мно- 
жество. Напомним, что это означает (см. стр. 50) 
существование достаточно простого алгоритма рас- 
познавания правильности фраз; несомненно, что го- 
ворящие обладают таким алгоритмом. Разумно было 


схемы 5) содержат в правых частях по два вспомогательных 


символа. В самом деле, основные символы грамматики Г* 
(т. е. А:, 42,..., Ал) в грамматике Г являются вспомога- 
тельными, так что правила вида Х ->› ТА; в рамках Г ока- 
зываются не «автоматными». Однако грамматика Г эквива- 
лентна автоматной, см. ниже. 


Г. 34 
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бы, по-видимому, полагать, что алгоритм распозна- 
вания правильности фраз естественного языка дол- 
жен обеспечивать такой процесс распознавания, при 
котором требуемый объем «оперативной памяти» 
сопоставим с длиной фразы — например, не пре- 
вышает числа Мп, где п — длина фразы, а М — 
достаточно большое число, не зависящее от п (т. е. 
некоторая константа). Это допущение тем более 
естественно, что, как известно из психологических 
экспериментов, объем оперативной памяти челове- 
ка вообще ограничен и притом весьма невелик *). 

Если же язык распознается алгоритмом с ука- 
занным ограничением на объем памяти («алгоритмом 
с ограниченным растяжением»), то он может быть 
порожден грамматикой, в которой для любой вы- 
водимой терминальной цепочки длины п существует 
такой вывод, в котором ни одна промежуточная це- 
почка не превосходит по длине числа Ки (К — неко- 
торая константа)**). Такую грамматику можно на- 
звать грамматикой с ограниченным растяжением; 
более точно, грамматика с ограниченным 
растяжением — это грамматика, у которой ем- 
‘костная сигнализирующая функция (стр. 119) не 
больше линейной. 

Доказано, что для любой грамматики с ограни- 
ченным растяжением может быть построена экви- 
валентная ей НС-грамматика. Таким образом, если 
принять оба наши допущения (а они, по-видимому, 
должны быть приняты), то приходится признать, 
что НС-грамматики в принципе способны описывать 
множество правильных фраз любого естественного 
языка, т. е. порождать любые правильные фразы 
данного языка, не порождая при этом никаких 
неправильных. (В частности, обе конструкции, 


*) С фактом ограниченности объема оперативной памяти 
человека связаны и те лингвистические соображения, кото- 
рые привели к понятию «грамматики сограниченной памятью», 
см. выше, стр. 97-104. 

**) Это утверждение может быть строго сформулировано и 
доказано, если надлежащим образом уточнить понятие ал- 
горитма, например, через понятие машины Тьюринга. 
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приведенные выше как примеры «непригодности» 
КС-грамматик, легко описываются НС-грамматиками. 
В самом деле, грамматика на стр. 91, порождающая 
язык {105'}, как отмечалось во второй сноске на 
той же странице, может быть заменена эквивалент- 
ной НС-грамматикой. ) 

Но это лишь одна сторона дела. Другая сторона, 
как и в предыдущих случаях, — это удабство и естест- 
венность описания. Известно, что проблема при- 
емлемости и границ «анализа по непосредствен- 
но составляющим» неоднократно дискутировалась 
в лингвистике. Не рассматривая эту сложную и 
интересную проблему во всех подробностях, мы по- 
пытаемся резюмировать ее основное содержание. 
Отмечаемые обычно недостатки метода 
НС, т. е. фактически НС-грамматик, сводятся к 
трем пунктам. 

1) С помощью НО-грамматик не удается 
естественно описывать фразы, 
содержащие разрывные —состав- 
ляющие. Об этом уже говорилось выше, приме- 
нительно к КС-грамматикам (стр. 95). Поскольку 
любые НС-грамматики сопоставляют фразе систе- 
му составляющих в точности таким же образом, 
как и ИС-грамматики, то все сказанное выше о не- 
проективных фразах относится и к НС-грамматикам. 

Цункты 2) и 3) касаются в сущности не только 
НС-грамматик, но и вообще всех порождающих грам- 
матик в строгом смысле определения на стр. 48. 

2) НС-грамматика, как и любая порождающая 
грамматика, содержит только прави- 
ла образования языковых выра- 
жений, например словоформ или фраз. Это зна- 
чит, что грамматика задает правильные выражения 
в отличие от неправильных. Сам термин «правила 
образования» заимствован из математической ло- 
гики, где он обозначает правила построения пра- 
вильных формул *). 


*) Например, алгебраическая формула (а - 5) с являет- 
ся правильной, а формула (а --) — неправильной, 
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Однако в логике рассматривается еще и другой 
тип правил — правила преобразова- 
ния. Эти последние задают определенные соотно- 
шения между правильными формулами, причем по 
существу это смысловые отношения. Так, в элемен- 
тарной алгебре это (известные всем из средней шко- 
лы) правила тождественных преобразований: из 
одного выражения получается другое с тем же чис- 
ловым значением, которое (значение) играет здесь 
роль смысла. В алгебре логики это правила вывода, 
позволяющие из одних истинных выражений полу- 
чать другие истинные выражения; здесь в качестве 
смысла выступает «истинностное значение», т. е. ис- 
тинность или ложность. Введение правил преобра- 
зования всегда означает переход к более высокому 
уровню рассмотрения языка, а именно к семанти- 
ческому уровню. 

Совершенно очевидно, что правила преобразова- 
ния необходимы и при описании естественных язы- 
ков (ср. стр. 153—154). Владение языком обязательно 
предполагает умение не только построить правиль- 
ную фразу, но и перейти от одной фразы к другим, 
либо полностью синонимичпым ей, либо отличаю- 
щимся от нее по смыслу на определенную «величи- 
ну». Так, говорящий легко делает из утвердитель- 
ного предложения вопросительное или отрица- 
тельное, из активной конструкции пассивную, без 
труда меняет стилистическую окраску текста, вы- 
ражает одну и ту же мысль разными способами ит. д. 
Эти возможности, которые обязательно должны 
Учитываться в описании языка, не могут быть из- 
ложены в терминах грамматик, и поэтому встает 
вопрос о разработке формального аппарата для пра- 
вил преобразования применительно к естественным 
языкам. 

Соответствующая задача была впервые четко 
сформулирована в работах Н. Хомского (Хомский 
1962). Выдвинутая им концепция быстро приобрела 
широкую популярность под именем «трансформа- 
ционной грамматики». (Сам термин «трансформация» 
— по-английски {гап${огта ол — в действительности 
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означает ‘преобразование’, так что га]ез оЁ 4тапз- 
{огтаопз = правила преобразования.) Пафос этой 
концепции, по нашему мнению, состоит во введении 
еще одного — семантического— уровня описания язы- 
ка*). В самом деле, инвариантом всех трансформаций 
обычно является смысл; иначе говоря, трансформа- 
ции — это преобразования, сохраняющие (или поч- 
ти сохраняющие) смысл. Таким образом, теория 
трансформаций оказывается по существу теорией 
синонимии в языке (имеется в виду синонимия в 
самом широком смысле слова, прежде всего синони- 
мия предложений, а также более крупных отрезков 
текста **)). В последнее время становится все более 
очевидным, что описание синонимии должно зани- 
мать в лингвистике одно из центральных мест. 
Отсюда вытекает и первостепенная роль трансфор- 
маций. 

Однако трансформации относятся не к тому же 
уровню, что НС-грамматики: НС-грамматики от- 
носятся к синтаксическому (в широком смысле сло- 
ва, см. ниже, стр. 153) уровню, а трансформации— 
к семантическому. Поэтому, когда говорят о недо- 
статочности НС-грамматик для описания языка, сле- 
дует помнить, что это верно только в смысле неох- 
вата НС-грамматиками семантического уровня; на 
своем, чисто синтаксическом уровне НС-граммати- 
ки оказываются принципиально вполне достаточ- 
НЫМИ. 

Порождающие грамматики (в смысле определе- 
ния на стр. 48) рассматриваются в рамках строго 
формальной теории; что же касается трансформаций, 
то здесь подобный уровень формализации пока не 
достигнут: предлагавииеся до сих пор трансфор- 
мационные правила не сформулированы в терминах 
одной простой операции, как правила грамматик 
(с их операцией подстановки). Задача дальнейшей 


*) Подробнее об описании семантического уровня языка 
см. ниже, стр. 153 и сл. 

**) В работах 3. Хэрриса (например, Хэррис 1962) тер- 
мин «трансформация» имеет другое значение. 
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формализации трансформаций является весьма акту- 
альной. 

В заключение сделаем следующее замечание 
терминологического характера. В работах Н. Хомс- 
кого и некоторых других авторов термин «порож- 
дающая грамматика» используется в двух смыслах: 
в широком — для обозначения любой системы фор- 
мальных правил, описывающих язык, с включением 
трансформационного и морфонологического компо- 
нентов, и в узком — для обозначения грамматик в 
смысле определения на стр. 48. В нашем изложении 
этот термин всегда используется только в узком 
смысле. При подобном словоупотреблении трансфор- 
мационные правила оказываются за рамками по- 
рождающей грамматики. 

3) НС-грамматика, как и любая порождающая 
грамматика, строит предложения сра- 
зу с точно определенным поряд 
ком слов — с тем, который эти предложения 
должны иметь в окончательном виде. При этом 
порождаемому предложению сопоставляется син- 
таксическая структура в форме упорядочен- 
ного дерева, т. е. дерева, где между узлами, 
кроме отношения подчинения, задаваемого самим де- 
ревом, имеется еще и отношение линейного порядка 
(правее — левее). Таким образом, в синтаксической 
структуре, определяемой НС-грамматиками, не рас- 
членены два совершенно различных по своей при- 
роде, хотя и связанных между собой отношения: 
синтаксическое подчинение и линейное взаиморас- 
положение. Между тем в лингвистической традиции 
всегда с полным основанием считалось, что охарак- 
теризовать синтаксическую структуру — это зна- 
чит указать отношения синтаксического подчинения 
(как бы ни толковалось это последнее понятие). 
Что же касается отношения линейного порядка, то 
оно должно характеризовать не структуру, а саму 
фразу. Порядок слов, конечно, зависит от синтак- 
СИческой структуры; оп определяется обязательно с 
ее учетом и тем самым является чо отношенио к 
ней чем-то производным, вторичным, 
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Поскольку это так, представляется целесообраз- 
ным видоизменить понятие порождающей граммати- 
ки таким образом, чтобы левые и правые части пра- 
вил подстановки представляли собой не линейно 
упорядоченные цепочки, а например, деревья (без 
линейной упорядоченности!), изображающие син- 
таксические отношения. Тогда правила‘ могли бы 
иметь, скажем, такой вид: 


А— В 


_ ^ >>Ау (пвлогКО-травиа) 
ИЛИ 2 аналог иС-правил 
р р Ра: 
й < 2 7 а (аналог НС-пра- 
А РУ 2 вил) 
{й или ВСЕ 


Черточки с индексами изображают синтакси- 
ческие связи различных типов; буквы А, В, С,...— 
синтаксические категории. ЛВ: взаимное рас- 
положение символов одного уровня подчинения не 
играет никакой роли и является на данной схеме 


хх 4 
случаиным: их означает в точности то же 


А 
самое, что и д 


В результате мы получили бы исчисление синтак- 
сических структур (а не фраз!) языка. Это исчисление 
не было бы порождающей грамматикой в узком 
смысле этого термина, однако его вполне можно рас- 
сматривать как часть порождающей грамматики в 
широком смысле; необходимо, однако, построить 
соответствующее формальное определение. Другую 
часть этой грамматики составляло бы исчисление, 
которое для любой данной синтаксической структу- 
ры задавало бы (возможно, с учетом каких-либо 
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других факторов, например, в русском языке — с 
обязательным учетом логического выделения и т. п.) 
все возможные для нее линейные последовательности 
слов. При таком подходе, в частности, снимается 
проблема разрывных составляющих, см. выше, 
стр. 106. Пример исчисления, порождающего син- 
таксические структуры, а затем выполняющего ли- 
нейное упорядочение их терминальных символов, 
дан в работе Ломковская 1965—1966; вариант си- 
стемы правил упорядочения слов в русском языке 
(исходя из синтаксической структуры, свойств 
самих слов и сведений о логическом выделении) 
содержится в Мельчук 1965; исчисление синонимии 
русских фраз («система перифразирования»), в ко- 
тором : формирование структур фраз отделено от 
построения соответствующих последовательностей 
лов, описано в Жолковский — Мельчук 1967. 


$0. О формальных свойствах 
порождающих грамматик 


В предыдущем параграфе мы коснулись ряда 
вопросов, связанных © применением формальных 
порождающих грамматик для описания естествен- 
ных языков. Там мы рассматривали в основном те 
свойства грамматик, которые представляют непосред- 
ственный интерес именно в плане лингвистических 
приложений, т. е. исследовали грамматики с точки 
зрения содержательной интерпретации. Теперь мы 
остановимся на некоторых «внутренних», чисто фор- 
мальных свойствах грамматик, т. е. сообщим отдель- 
ные факты из математической теории порождающих 
грамматик. Грамматики представляют собой чисто 
математический объект и как таковой могут изу- 
чаться чисто математическими средствами. Далеко 
не все результаты такого изучения имеют лингви- 
стическую интерпретацию; многие из них сами по 
себе вряд ли нужны для исследования естественных 
языков. Тем не менее все факты, относящиеся 
к грамматикам, — мы имеем в виду их формальные 
свойства — занимают в единой математической тео- 
рии грамматик определенное место и в рамках этой 
теории необходимы. Дело в том, что ллобая теория 
развивается по своим внутренним законам и может 
существовать только как целое. Выделить в ней 
некие особые разделы, интересные для приложений, 
и развивать их отдельно невозмозкно. Поэтому в той 
степени, в какой сама теория грамматик в целом 
признается полезной и важной для лингвистики, 
в конечном счете (т. е. хотя бы и косвенно) оказы- 
ваются нужными и чисто математические резуль- 
таты, 
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Математическая теория грамматик в настоящее 
время довольно хорошо разработана. Мы остановим- 
ся здось только на двух ее разделах — на алгорит- 
мических проблемах и на проблеме оценки сложно- 
сти вывода. 


Алгоритмические проблемы 


В теории грамматик часто возникают вопросы о 
наличии/отсутствии того или иного алгоритма, нап- 
ример: 

1) Существует ли алгоритм, позволяющий по 
любой данной КС-грамматике узнать, является ли 
порождаемый ею язык конечным (т. е. конечно ли 
порождаемое ею множество терминальных цепочек)? 

2) Аналогичный вопрос можно задать и относи- 
тельно НС-грамматик. 

3) Существует ли для данной грамматики Г ал- 
горитм, позволяющий по паре (терминальных) це- 
почек 1х и у, выводимых в данной грамматике, опре- 
делить, замещаемо *) ли х на у в языке С(Г)? 

4) Существует ли алгоритм, позволяющий уз- 
нать относительно любой КС-грамматики, припи- 
сывает ли она каждой порождаемой терминальной 
цепочке только одну синтаксическую структуру, 
т.е. имеются ли терминальные цепочки, которые мо- 
гут быть выведены в данной грамматике более чем 
одним способом? 

Подобные вопросы и образуют круг алгоритми- 
ческих проблем теории грамматик. . 

Сформулируем некоторые результаты, относя- 
щиеся к данной области. 

1. В классе всех грамматик ни одно нетривиаль- 
ное свойство языков, порождаемых грамматиками, 
не распознаваемо. (Мы называем свойство языков 
нетривиальным в данном классе языков, если в этом 
классе имеются как языки, обладающие этим свой- 
ством, так и языки, им не обладающие. Например, 
свойство «порождаться грамматикой» в классе язы- 
ков, порождаемых грамматиками, тривиально, а 


*) Определение замещаемости см. на стр. 165. 
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свойство «быть конечным» не тривиально.) Нерас- 
познаваемость нетривиальных свойств означает, 
что если иметь дело с грамматиками, на которые не 
наложено никаких ограничений, то ни для какого нет- 
ривиального свойства языков не существует алго- 
ритма, позволяющего по любой грамматике узнать, 
обладает ли порождаемый ею язык этим свойством. 

2. В классе НС-грамматик: 

а) Свойство порождать язык, содержащий дан- 
ную цепочку, распознаваемо, т. е. для каждой це- 
почки существует алгоритм, позволяющий по лю- 
бой НС-грамматике узнать, входит ли эта цепочка 
в порождаемый данной грамматикой язык. Доказа- 
тельство этого факта по существу содержится на 
стр. 50—53, где был указап алгоритм, позволяю- 
щий по произвольной неукорачивающей граммати- 
ке Ги произвольной цепочке х узнать, выводима 
ли д вГ (т.е. принадлежит ли х к Г(Г)). Важно от- 
метить, что алгоритм этот один и тот же для всех 
Ги всех х и, таким образом, ни от Г, ни от х не 
зависит. Стало быть, распознаваемость свойства 
содержать данную цепочку доказана для класса 
неукорачивающих грамматик и тем более для его 
подкласса — НС-грамматик. 

Отсюда следует распознаваемость также и неко- 
торых сходных свойств-—таких, как содержать одно- 
временно 2,3,..., п данных цепочек, содержать хотя 
бы одну из п данных цепочек, содержать данную 
цепочку х при условии, что другая данная цепочка 
у (определенным образом связанная с 2) принадлежит 
языку и т. п. 

6) Практически все остальные «хорошие» (естест- 
венно возникающие) нетривиальные свойства язы- 
ков нераспознаваемы. Так, для НС-грамматик не- 
распознаваемы свойства порождать данный (про- 
извольный) НС-язык, порождать конечный язык, 
порождать ВС-язык, порождать язык с замещаемо- 
стью 4 нау (гдех и у — произвольные фиксирован- 
ные цепочки) и т. д. 

3. В классе КС-грамматик оказываются распо- 
знаваемыми некоторые из тех свойств, которые не- 


Т..4 


ТТ... 
Т, 2 


Алгоритмические проблемы 115 


распознаваемы в классе НС-грамматик. (Разумеет- 
ся, свойства, распознаваемые для НС-грамматик 
(ср. пункт 2а), распознаваемы и для КС-грамматик.) 
Так, здесь распознаваемы следующие свойства: 

а) Свойство порождать пустой язык (существует 
алгоритм, позволяющий для любой ЦС-грамматики 
узнать, порождает ли она хотя бы одну терминаль- 
ную цепочку). 

6) Свойство порождать конечный язык. 

в) Свойство порождать хотя бы одну цепочку, 
содержащую вхождение данной цепочки 5. В линг- 
вистической интерпретации это может означать, 
например, следующее: по КС-грамматике языка для 
любого словосочетания можно определить, входит 
ли оно хотя бы в одну фразу языка. Таким образом, 
в отличие от НС-грамматик, где распознаваема пра- 
вильность целых фраз, но не частей фраз, для 
КС-грамматик распознаваемо и то и другое. 

Тем не менее многие важные свойства нераспоз- 
наваемы и для ВС-грамматик. В частности, нерас- 
познаваемы следующие свойства: порождать А- 
язык; порождать полный язык (содержащий все- 
возможные цепочки, составленные из терминальных 
символов); иметь эквивалентную ИС-грамматику, 
приписывающую каждой терминальной цепочке 
только одну синтаксическую структуру, и т. д. 

Заметим еще, что для КС-грамматик неразреши- 
ма проблема распознавания эквивалентности (про- 
извольных двух грамматик), т. е. не существует ал- 
горитма, позволяющего по любой паре КС-грамма- 
тик узнать, являются ли они эквивалентными. 

4. В классе А-грамматик распознаваемы прак- 
тически все «интересные» свойства, в том числе все 
перечисленные в предыдущих пунктах; проблема 
раснознавания эквивалентности здесь также раз- 
решима. 

Из проблем, относящихся к алгоритмам не для 
классов грамматик, а для конкретных фиксирован- 
ных грамматик, мы упомянем только одну: так на- 
зываемую проблему распознавания замещаемости. 
Она состоит в том, чтобы для данной грамматики Г 


Г: 240 
Т.о 
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найти алгоритм, позволяющий по любой’ паре 
цепочек т, у узнать, замещаема ли х наув 
языке Г(Г). Для некоторых грамматик такие ал- 
горитмы существулот, в частности, для всех А-грам- 
матик. Однако имеются примеры ИС-грамматик, 


для которых подобпого алгоритма нет. 
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Кроме алгоритмических проблем, к матема- 
тической теории грамматик относятся также проб- 
лемы оценки сложности вывода в грамматиках. 
Сложность вывода естественно измерять либо числом 
шагов, т. е. числом промежуточных цепочек, либо 
необходимым объемом «памяти», например длиной 
промежуточных цепочек *). Для оценки сложности 
по числу шагов предложена мера 

тг (п) = шах тг, х, 
(х) <п 

где Г — данная грамматика; х — произвольная 
цепочка, выводимая в Г; [(5) — длина цепочки х 
(число символов в 2); тг„— число шагов («время») са- 
мого короткого вывода цепочки 5 в Г; п — произ- 
вольное натуральное число. Чтобы найти тг (п), 
нужно, как видно из формулы, найти для каждой 
выводимой цепочки, по длине не превосходящей п, 
наименьшее «время» (число шагов) вывода этой це- 
почки в Г (дело в том, что цепочка х может иметь в 
Г много разных выводов разной длины); затем среди 
всех этих «времен» берется максимальное. Это и бу- 
дет значением функции тг(й) —так называемой 
временной сигнализирующей функции. 
Другими словами, тг (И)—это такое число шагов, ко- 
торое, с одной стороны, заведомо достаточно для вывода 
л1обой цепочки не длиннее и, а с другой стороны, не- 
обходимо: среди выводимых цепочек не длиннее п 
имеется хотя бы одна цепочка, которую нельзя вы- 
вести меньше чем в тг (7) шагов. 


*) Объем памяти может измеряться и иначе: числом вспо- 
могательных символов в промежуточных цепочках, расстоя- 
нием от первого вспомогательного символа до конца цепочки 
(ср. стр. 98) ит. п. 


ТТ, 


Т, > 
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Исходя из понятия временной сигнализирующей 
фупкции, можно получать оценки сложности вывода 
в разных грамматиках."Гак, на стр.'.51—52 фактически 
было показано, что для любой неукорачивающей 
грамматики Г имеет место неравенство тг(п) < р", 
где р — общее число основных и вспомогательных 
символов. Очевидно, что это неравенство имеет 
силу, в частности, и для НС-, и для ИС-грамматик. 
Однако для последних указанную оценку можно 
значительно улучшить (т. е. понизить): для любой 
ЕС-грамматики Г, выполняется неравенство тг(п) < 
<2Сп, где С—число вспомогательных символов в Г\. 
Эта оценка получается из следующих несложных со- 
ображений: любой КС-вывод можно провести так, 
чтобы на каждом шаге заменялся самый левый вспо- 
могательный символ; на каждом шаге длина цепочки 
либо не изменяется, либо увеличивается, причем воз- 
можны шаги трех типов: 

1. д В («неудлиняющий нетерминальный», 
А и В — вспомогательные символы); 

2. А ->а («неудлиняющий терминальный», А — 
вспомогательный, а — основной символ); 

3. А>—а, 4.... 4. т 1 («удлиняющий»). 
Если вывод не содержит «петель» (повторений про- 
межуточных цепочек; ср. стр. 52), то в нем нигде не 
может быть больше чем С «неудлиняющих нетерми- 
нальных» шагов подряд. В самом деле, если бы было 
произведено подряд Ё таких шагов, где А > С, то 
соответствующие цепочки вывода имели бы вид: 

АУ 
1-й шаг 
ХАУ 
2-й шаг 
АУ 
С-й шаг 
ХАсУ 


К-й таг 
АкУ 


"Т. 3. 
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Здесь х — цепочка основных символов; А, А.,... 
...А; — вспомогательные символы; У — некоторая 
цепочка произвольного вида. Уже С шагов дают 
(С -- 1) цепочек; поскольку эти цепочки различают- 
ся только символами А., Д,,..., Ас, а среди этих 
символов — не более С различных, две из этих це- 
почек обязательно совпадут, т. е. получится «петля». 
Таким образом, в любом ЕС-выводе без «петель», 
а тем более в кратчайшем выводе не бывает более 
(С — 1) неудлиняющих нетерминальных шагов под- 
ряд. Между двумя сериями таких шагов обязатель- 
но должен вклиниваться хотя бы один шаг типа 2 или 
3; а таких шагов всего не более 2и (не более и тер- 
минальных, поскольку вся цепочка состоит из п тер- 
минальных символов, и не более и «удлиняющих», 
поскольку каждый «удлиняющий» шаг увеличивает 
длину цепочки, а увеличиться больше чем на И эта 
длина не может). Стало быть, мы имеем не больше чем 
2п серий шагов типа 1 (не более чем по (С — 1) 
шагов в серии} и не более чем 2п шагов типа 2 и 3; 
общее же число шагов не превосходит 2 п (С —1) + 
+-2п = 2Сп, что и требовалось доказать. 

Мы проиллюстрировали получение верхних 
оценок сигнализирующей функции. Получение ниж- 
них оценок оказывается более сложным. Приведем 
без доказательства одну такую оценку; отметим, 
что другие нижние оценки пока неизвестны. 

Язык, состоящий из всевозможных цепочек вида 
хх’ (см. стр. 91), не может быть порожден никакой 
такой НС-грамматикой Г, у которой временная 
сигнализирующая функция тг(й) по порядку мень- 
ше *) чем 72. В то же время НС-грамматика, у ко- 
торой т имеет порядок (скорости роста) 72, порожда- 
ет такой язык; именно такой порядок имеет сигна- 
лизирующая функция грамматики, приведенной на 
стр. 94. 

*) Слова «по порядку меныше» приблизительно означают 


«много меньше», «растет существенно медленнее»; точпое оп- 
ределение таково: функция } (п) по порядку меньше функции 


& (п), если Пт — 0 при п -+ сс. 


Е (п) 
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Грамматика, у которой временная сигнализирую- 
щая функция не больше линейной, называется грам- 
матикой с ограниченным —замедлени- 
ем. В частности, всякая ИКС-грамматика является 
грамматикой с ограниченным замедлением — это сле- 
дует из неравенства, доказанного на стр. 117—118. 
Но уже НС-грамматика может не быть грамматикой 
с ограниченным замедлением. 

Аналогичным образом может быть введена и 
емкостная сигнализирующая функция 
от (п), характеризующая необходимый для вывода 
объем памяти. Именно, 


бг (п) = тах бог, х, 
(х)<л 

где Г, хип имеют тот же смысл, что и в определении 
временной сигнализирующей функции (стр. 116), 
а ог» есть емкость («объем памяти») наименее 
емкого вывода цепочки хв Г. (Емкостью выво- 
да мы называем длину самой длинной цепочки, 
входящей в этот вывод.) 

В математической теории грамматик существуют 
и другие направления исследования, на которых, 
однако, мы здесь останавливаться не будем. 


$ 6. Некоторые другие понятия 
и проблемы математической 
лингвистики 


Закончив более или менее связное рассмотре- 
ние одного из разделовматематической лингвистики — 
теории порождающих грамматик, мы попытаемся 
теперь дать краткий очерк ряда других разделов, с 
тем чтобы читатель мог получить более полное пред- 
ставление о всей дисциплине в целом. Этот очерк 
отнюдь не призван служить обзором хотя бы основ- 
ных достижений математической лингвистики и 
никоим образом не претендует на полноту и последо- 
вательность. Мы просто коснемся — с очень разной 
степенью подробности — нескольких отдельных до- 
статочно важных вопросов, не заботясь специально 
о единстве изложения. 

За последние годы в лингвистике сложилось 
следующее представление об основных направлени- 
ях исследования языка и о взаимоотношениях меж- 
ду ними *). Прежде всего различаются: 

А) «собственно лингвистические» исследования 
и, так сказать, 

Б) «лингвистические исследования второго по- 
рядка». Содержанием первых является описание 
языка как такового, в частности моделирование ре- 
чевой деятельности; вторые же направлены на изу- 
чение методов исследования языка, в частности на 
моделирование деятельности лингвистов. Различие 
между А и Б не совпадает с различием между опи- 
сательной и теоретической лингвистикой: в А вклю- 
чаются не только описания конкретных языков, 
но и теория описания языка вообще, построение 


*) Это представление мы излагаем в схематизированном и 
упрощенном виде, чтобы сделать его более отчетливым. 
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схем конкретных описаний и т. п. Во втором на- 
правлении (Б) можно выделить (Г) проблемы, свя- 
занные с уточнением самих лингвистических поня- 
тий, —изучение оснований лингвистики, и (11) пробле- 
мы, связанные с уточнением процедур исследова- 
ния. Эти последние в свою очередь подразделяются 
на 1) процедуры работы исключительно с текстами — 
чисто «дешифровочный» подход, и 2) процедуры ра- 
боты с привлечением информанта — «эксперимен- 
тальный» подход. (Изложенная классификация линг- 
вистических направлений близка к классификации, 
предложенной в книге Апресян 1966.) 

Намеченную здесь картину можно для нагляд- 
ности представить так: 

Лингвистика. 

А. Собственно лингвистика. 

Б. Моделирование лингвистических исследований. 

Т. Основания лингвистики. 

П. Процедуры исследования. 

(Еще раз напоминаем, что все эти деления весьма 
приблизительны; четких границ между разделами 
нет!) 

Оказывается, что и в математической лингви- 
стике естественно выделяются аналогичные направ- 
ления. Поэтому мы будем вести наш обзор, ориен- 
тируясь на те же самые рубрики. 

Математическая лингвистика также может быть 
подразделена на: 

А) моделирование языков и 

Б) моделирование исследования языков (ср. 
«устройства А и Б» в концепции Н. Хомского — 
Хомский 1965а, стр. 480—481). 


А. Моделирование языков 


В данный раздел входит прежде всего теория 
формальных грамматик. Часть этой теории, связан- 
ная с порождающими грамматиками, была изложена 
в $$ 2—5. Другая часть этой теории относится к рас- 
познающим грамматикам (стр. 24). Мы охарактери- 
зуем здесь два класса распознающих грамматик. 
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категориальные грамматики и автоматы с магазинной 
памятью. 

К этому же разделу можно, по-видимому, отнести 
те работы, которые обычно объединяются под назва- 
нием «логический анализ языка» (см. ниже, стр. 153). 


Ватегориальные грамматики, 
(Е-грамматики) 


Допустим, что перед нами стоит цель построить 
механическую процедуру синтаксического анализа 
предложений. Обычное представление о том, как 
это следует делать, приблизительно таково. Прежде 
всего надо разбить все словоформы на классы и со- 
ставить словарь, где каждой словоформе будет при- 
писан ее синтаксический класс (например, длинная— 
Ак едим, Рича — Тдетр И т. п.). Затем фор- 
мулируются правила комбинирования синтак- 
сических классов, а именно, указывается, какие 
классы могут сочетаться с какими и каковы будут 
классы получающихся словосочетаний. Эти правила 
можно представить себе, скажем, в виде хорошо 
известных лингвистам правил НС-анализа, т. е. 
что-то вроде 


Ао =о 
5 + брод = 5 
ТЕ - бин = ИЯТ и т. п. 


(Заметим, что эти правила по существу суть «обра- 
щенные» КС-правила; подробнее об этом см. также 
ниже, стр. 151.) 

Однако представляется заманчивым обойтись 
без списка правил указанного типа. Для этого мож- 
но поступить так: разработать такую систему коди- 
рования синтаксических классов (словоформ и сло- 
восочетаний), чтобы возможность комбинирования 
двух классов, а также класс результирующего со- 
четания можно было усмотреть непосредственно из 
кодов исходных классов. Другими словами, все 
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коды должны иметь определенную «внутреннюю фор- 
му», быть «говорящими», и притом, что особенно 
важно, коды разных классов должны быть согласо- 
ваны между собой и образовывать алгебраическую 
систему так, чтобы с помощью несложных опера- 
ций можно было по кодам комбинирующихся клас- 
сов механически получать код класса полученной 
комбинации. Таким образом, здесь вся информация 
о синтаксической сочетаемости сосредоточена не в 
списке правил (как это обычно делается в линг- 
вистике и как это было во всех рассмотренных 
выше грамматиках), а в самих синтаксических ко- 


^В дах слов. 

На основе идеи перенесения всей информации о 
сочетаемости в синтаксический код слова можно по- 
строить, вообще говоря, разные классы грамматик. 
Однако к настоящему времени фактически имеется 
только один такой класс, а именно, К-грамматики, 
о которых здесь идет речь. 

Сущность К-грамматик состоит в том, что для 
реализации идеи «товорящего» синтаксического 
кода привлекается следующее фундаментальное 
соображение. Все синтаксические классы можно 
разделить на два типа: некоторые классы считаются 
основными, или элементарными, а другие рассмат- 
риваются как (одноместные) операторы, каждый 
из которых, будучи применен к какому-либо клас- 

АВ су (любого тина), дает снова синтаксический класс *). 
При этом применяется особый способ обозначения 
операторов, который можно проиллюстрировать 

‘таким примером: пусть имеются элементарные син- 
таксические классы бим (существительное в им. пад.) 
и ПРЕДЛ (предложение); тогда синтаксический 
класс, присоединяемый к 9 м справа и дающий пред- 
ложение (т. е. непереходный глагол типа спит, 
ходит, плачет,...: Море спит и т. п.), есть опера- 
тор, действующий на 9м справа и переводящий 
5,м в ПРЕДЛ; такой оператор обозначается 


*) Результирующий класс может в частном случае соз- 
падать с исходным. 
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[5им \ ПРЕДЛ]. Действие этого оператора на бим 
можно трактовать как сокращение дроби: 
5 имо им \ ПРЕДЛ] = ПРЕДЛ. Класс глаголов типа 
существует, имеется, появляется, ... должен 
рассматриваться как оператор, действующий на бим 
слева и дающий ПРЕДЛ (Существует, закон и т. п.); 
такой оператор обозначается [ПРЕДЛ / бим] и тоже 
«сокращается» с биы: [ПРЕДЛ / бим| 5 им= ПРЕДЛ. 
Прилагательное можно обозначить как [5/5] (пре- 
позитивное) или [55] (постпозитивное); соответст- 
вующие сокращения имеют вид: [5 /5]5 = 5 и 
515 \ 5] = 

Уже из этих упрощенных примеров видно, как 
должен выполняться анализ предложения: всем 
словоформам нриписываются с помощью словаря 
коды указанного типа (в случае синтаксической не- 
однозначности словоформы ей приписывается не- 
сколько кодов); затем осуществляются все возмож- 
ные сокращения, и если в результате получится 
символ предложения ПРЕДЛ, то это означает, что 
анализируемое предложение грамматически пра- 
вильно, а тот способ сокращения, который привел 
к символу ПРЕДЛ, задает синтаксический анализ 
этого прэдложения. 

Понятие К-грамматики было введено И. Бар- 
Хиллелом (Ваг-НШе] — СаЁйтал — ЭВапиг 1960), 
существенно опиравшимся на работы К. Айдукеви- 
ча. Содержательное изложение соответствующих 
идей дано в Ваг-Н1Ще] 1953; см. также Бар- Хиллел 
1964 и Гладкий 1966. 

Теперь мы можем перейти к определению В- 
грамматики. Для этого надо ввести следующие по- 
нятия. 

1. Рассматривается конечное множество сим- 
волов И — «основной словарь»; его роль и интер- 
претация таковы же, как и для ‘порождающих грам- 
матик. 

2. Далее, имеется конечный набор И элемен- 
тарных (синтаксических) категорий — ЭК; 
формально ЭК — это просто символ из 7, а содержа- 
тельно — это класс слов (точнее, словоформ или 
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морфем) или словосочетаний. Из ЭК строятся ка- 
тегории по следующим правилам: 

1) Всякая ЭК есть категория; 

2) если Фи Ч” — категории, то [Ф\\ Ч] и [Ф\ +] — 
тоже категории; 

3) никаких других категорий нет (0б интерпре- 
тации выражений [Ф/4] и [Ф\\ Ч] см. выше). 

3. Имеется также функция }, которая каждому 
основному символу ставит в соответствие одну или 
несколько (конечное число!) категорий. Содержатель- 
но эт приписывающую функцию 
можно представлять себе как задание в словаре при 
словах их синтаксических классов (нескольких — 
в случае омонимии: течь — существительное или 
глагол). 

4. Среди ЭК выделяется главная кате- 
гория Ё; это, так сказать, «конечный» символ, 
роль которого в некотором смысле противоположна 
роли начального символа Г порождающей грамма- 
тики (из Г развертывается порождаемая цепочка, 
к Е свертывается распознаваемая цепочка). 

К-грамматика представляет собой совокупность 
описанных четырех объектов, т. е., говоря формаль- 
но, упорядоченную четверку ‹Т, Т', р, Е). 

Укажем, как работает такая грамматика, введя 
предварительно еще одно понятие: сокращение це- 
почек категорий. Под непосредственным 
сокращением понимается одна из двух опе- 
раций: 

либо некоторое вхождение цепочки [Ф /Ч] Ч заме- 
няется на Ф (правое сокращение), 

либо некоторое вхождение цепочки [Ф[Ф\] 
заменяется на Ч (левое сокращение). 

Запись [Ф/УТ] читается «Ф над Ч», а Ф\ - 
«Ф под ЧФ», и непосредственное сокращение удобно 
представлять себе как сокращение дробей с тем 
существенным отличием, что здесь взаимное рас- 
положение «сомножителей» небезразлично. Катего- 
рия [Ф/Т] — это категория, приписываемая та- 
кой цепочке, которая, находясь слева от цепочки 
с категорией Ч, образует вместе с нею цепочку, 
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имеющую в целом категорию Ф: 
Ф 


Иначе говоря, [Ф//У], как уже указывалось, есть 
оператор, который, действуя на Ф` слева, превращает 
еев Ф 

Совершенно аналогично интерпретируется ка- 
тегория [Ф`\ 9], но только здесь идет речь о при- 
соединении, во-первых, не к ТФ’, ак Ф, а во-вторых, 
не слева, а справа. 

Определим сокращение (не обязательно 
непосредственное): цепочка категорий а сокращается 
до цепочки категорий В, если В получается из а по- 
следовательностью непосредственных сокращений. 

Например, цепочка 


ох = [ХМ УХ 218 [7/7] 
ЦПУ \ ХИЙ/Х]Х 


сокращается до цепочки В = [Х`\\ У]ё путем четырех 
непосредственных сокращений: 


#«=ШХМУ ИХ 212 [УГУ 1 ХИ Х 


у 
1. [71/212 т 
ИХ ТИХИН/УШУ ИТГ ХИ/ХХ 
т 9 9 
2. 0[9\ Х] Хх 
ИХ Их мМихХХ 
8 
3. [в/Х]Х -ъе 
ХХУИИХХ 
| 
4. [@/Х1Х 2 
= [Хх \ УМ 


Отметим, что одну и ту же цепочку категорий 
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можно, вообще говоря, сокращать разными способа- 
ми, применяя непосредственные сокращения в раз- 
ном порядке. Соответствующий пример будет рас- 
смотрен ниже, на стр. 132. 

Теперь мы перейдем к описанию работы К-грам- 
матики, причем для большей наглядности мы сна- 
чала построим пример такой грамматики. 

Основной словарь Т этой грамматики (С) 
состоит из русских словоформ; в качестве элементар- 
ных категорий выберем следующие: 


ПРЕДЛ — предложение; 

т", ш, э› Где ИЯ" — непереходный глагол, а 4, у, 
2 и и — переменные, обозначающие соответственно: 
х— род, у-- число, ш — лицо и и-- время; ср. стр. 


57. Таким образом, о: одна ЭВ, а сок- 
ращенное обозначение для 54 ЭК :54 =3 (рода) Х 
х2 (числа) Х 3 (лица) Х 3 (времени); 

у у, изъ где У" — переходный глагол, а %, У, 
2, и имеют тот же смысл, что и выше; 

Рг., где Рг — общее обозначение для предлога, 
а : — переменная, обозначающая конкретный пред- 
лог: без, в, на, от,... Рг, — также сокращенное обо- 
значение для нескольких десятков ЭК. 

Категорию ПРЕДЛ будем считать главной. 

Разумеется, мы будем иметь дело не со всеми рус- 
скими словоформами, а лишь с несколькими: депила, 
на, метель, кружкй, стрелы, стекле, и. Только для 
них мы и определим значения принисывающей функ- 
ции Г, причем укажем не все ее возможные значе- 
ния *), а только те, которые нужны для нашего 
примера: 


1) уд (лепила) — у ед.з, поош 


2) р (на) = Рина 
3) Г (метель) = [ПРЕДЛ Уж ед, з, ®] 
*) Напомним, что ГЫ— многозначная функция (стр. 125). 


Так, словоформе метель она должна была бы сопоставлять 
много разных категорий, см. ниже. 
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А, 5) Г (кружки) = }(стьре. ==) = 
= [Их лы , Ух, 5], 
6) (стоке) = [Рина [Их в, о М, Тя лч, 5] 
7) (и) = Ух, Ил в $ ПИ ль 
ХР в, ПИ [Ух уу, Ух, 5. 


Категория, приписанная словоформе метель, 
есть оператор, который, действуя слева на непере- 
ходный глагол соответствующего рода, числа и ли- 
ца, дает предложение; другими словами, это кате- 
гория «Подлежащее, стоящее перед сказуемым» 
(«Левое подлежащее»). Чтобы учесть возможность 
постановки подлежащего после сказуемого, нам при- 
шлось бы приписать словоформе метель еще одну 
категорию: [ТУ сд,з, ХПРЕДЛ]*). А если бы мы 
захотели учесть также и омонимию падежей — форма 
метель может быть и прямым дополнением, правым 
или левым, — то мы должны были бы приписать 
этой м еще две группы категорий: 


( Н 
Ух. у, 10, 5 И, и [ ль, 5х уу, 3]. 


а и это еше не все: чтобы отразить способность 
формы метель сочетаться с разными предлогами 
(в метель, за метель...), ей надо было бы припи- 
сать еще целый ряд категорий. 

Сказанное здесь относится и к случаям 4) —7): 
этим словоформам приписаны не все категории, 
которые они имеют в сском языке, а только те, 
которые нужны для нашего примера. А именно, 
словоформам кружки и стрелы приписана катего- 
рия «Правое прямое дополнение» **), словоформе 
стекле — категория «Дополнение предлога на» 
(оператор, действующий на на справа и дающий оп- 
ределение к переходному ***) глаголу), а словофор- 

*) Строго говоря, это не одна категория, а группа из трех 
категории: переменная ? может принимать три значения. 

**) «Правое прямое дополнение» есть оператор, действую- 
щий на переходный глагол справа и превращающий его в 
глагольную группу, эквивалентную непереходному глаголу. 


***) Определение к непереходному глаголу должно иметь 
другую категорию. 
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ме и — категория «Союз, соединяющий правые 
прямые дополнения» (оператор, который, оказав- 
шись между двумя правыми прямыми дополнения- 
ми, дает снова правое прямое’ дополнение). 

Итак, грамматика С, построена. На ее примере 
мы можем описать принций работы К-грамматик 
вообще. 

Пусть имеется цепочка х = а, а, аз... ау из симво- 
лов основного словаря некоторой К-грамматики С1. 
Приписывающая функция } этой грамматики позво- 
ляет сопоставить цепочке х цепочку категорий Ё = 
= (а) Г(а>) Г(аз)...Г(а,) (в общем случае таких цепо- 
чек может быть несколько — за счет многозначно- 
сти функции 7, т.е. омонимичности некоторых 4,). 
Если эта Цепочка общем случае — хотя бы одна 
из таких цепочек) сокращается до одной категории 
Ф, то мы будем говорить, что грамматика С, при- 
писывает цепочке х категорию Ф. 

Рассмотрим, например, следующую цепочку рус- 
ских словоформ: Метель лепила на стекле кружки 
и стрелы. В грамматике С, этой цепочке может быть 
сопоставлена цепочка категорий, изображенная на 
схеме 1 (см. стр. 130). Данную цепочку категорий 
можно сократить следующим образом: 

1) бе», 2) вк — в, 3) 10 —^, 4) ВА У, ед. прошь 
5) У ед, 3, прот & — Я оз прошь 6) ат, 3. прош => 
— ПРЕДЛ. Это значит, что а, приписывает цепоч- 
ке Метель лепила на стекле кружки и стрелы катего- 
рию ПРЕДЛ, т. е. «признает» эту ценочку предложе- 
нием. Соответственно цепочке ЕР ужки и стрелы при- 


ут 
писывается категория = [У ед. прош `\ Ик.ед,3 прош | 
(«Правое прямое дополнение»), цепочке лепила на 
стекле — категория Ут едзпрош, а цепочке лепила 
на стекле кружки и стрелы — категория Уз”ед,3, прош. 
В то же время нетрудно видеть, что таким цепоч- 
кам, как метель лепила на, стекле кружки и или 
на и, на лепила, лепила стекле и т. п., данная грам- 

матика не приписывает никаких категорий. 
Таким образом, для произвольной цепочки (из сим- 
волов словаря Г) К-грамматика позволяет узнать, 


5 А. Гладкий, И. Мельчук 
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какими категориями характеризуется эта цепоч- 
ка и характеризуется ли она вообще какими бы 
то ни было категориями. В частности, для каждой 
цепочки К-грамматика позволяет узнать, является 
ли эта цепочка правильным предложением, т. е. 
позволяет распознавать грамматическую правиль- 
ность. Более того, если цепочка оказывается грам- 
матически правильным предложением, то К-грам- 
матика выделяет в нем словосочетания, т. е. состав- 
ляющие (в обычном смысле этого слова). Способ 
построения дерева составляющих по записи процесса 
сокращения исходной цепочки категорий крайне 
прост: составляющей будет каждая подцепочка, 
для которой соответствующая цепочка категорий 
на некотором шаге процесса сокращения сокраща- 
ется до одной категории; эта категория может рас- 
сматриваться как синтаксический тип данной со- 
ставляющей. В нашем примере имеется шесть состав- 
ляющих (не считая одноэлементных), соответствую- 
щих шести шагам процесса сокращения: 

1) и стрелы (типа х), 

2) кружки и стрелы (типа 3), 

3) на стекле (типа ^), 

4) лепила на стекле (типа У д.3, прош), 

5) лепимла на стекле кружки и стрелы (типа 

НЫ пд, 3, прош ), 

6) вся фраза целиком (типа ПРЕДЛ). 

Эта система составляющих представляется при- 
вычным деревом НС: 


Метель лепила на стекле кружки и стрелы 
% В т 9 ё [д 8 
| | | 
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В случае синтаксически неоднозначного предло- 
жения К-грамматика может сопоставлять ему раз- 
ные системы составляющих, т. е. давать разные ана- 
лизы. Во-первых, это бывает потому, что соответ- 
ствующая предложению цепочка категорий может 
сокращаться разными способами, например: 


... медлнные протоны Ц н2й троны 
[9/5] 5 [5\51/5] 5 
—— в. 

9% 


——_ 


Т 

Первый способ сокращения: ао 5, фо —В, 
58 >, что дает систему составляющих 

... (медленные протоны) и нейтроны. 

Второй способ сокращения: 5 — В, 58 — 5, аэ-—> 
— 5, что дает... медленные (протоны и нейтроны). 

Во-вторых, предложению может быть приписано 
несколько цепочек категорий и это также может 
привести к разным системам составляющих, см. схе- 
му 2 на стр. 130. 

Для первой цепочки категорий получается раз- 
ложение (он (вынул (трубку (из глины)))), т. е. 
трубка была глиняная, а для второй — (он ( (вынул 
трубку) (из глины ))), т. е. трубка была вынута 
из глины. Все необходимые выкладки читателю ре- 
комендуется выполнить самостоятельно — в качест- 
ве упражнения *). 

С каждой К-грамматикой естественно связывает- 
ся множество тех цепочек, которые эта грамматика 
признает предложениями, т. е. приписывает им ка- 
тегорию ПРЕДЛ. Это множество называется язы- 
ком, определяемым К-граммати- 
`кой, или К-языком. 

Возникает вопрос: каково соотношение между 
языками, определяемыми К-грамматиками, и язы- 


*) Здесь фактически затронута целая новая область син- 
таксической теории, а именно, синтаксическая неоднознач- 
ность: ее природа, ее различные типы, ее соотношение с се- 
мантической неоднозначностью и т. п. Однако в рамках на- 
стоящей книги мы не имеем возможности останавливаться 
на этих вопросах. 


1 
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ками, порождаемыми порождающими грамматика- 
ми? Легко видеть, что всякий И-язык: есть КС-язык 
и, более того, что для всякой К-грамматики можно 
построить эквивалентную ей КС-грамматику (т. е. 
порождающую в точности тот же язык, который 
определяется исходной К-грамматикой). Наметим 
здесь идею очень простого доказательства этого 
факта: еелиа=<Т7,М’, г, ПРЕДЛ»есть К-грамматика, 
то соответствующая ИС-грамматика Г строится 
так: 1) основным словарем в Г будет 7; 2) вспомо- 
гательным словарем в Г будет множество всех ка- 
тегорий, являющихся значениями приписывающей 
функции [ или их частями *); 3) начальным симво- 
лом служит ПРЕДЛ; 4) правила грамматики Г бу- 
дут двух типов: во-первых, правила вида “—Ф[Ф\\ 4] 
и Ф—[Ф/И]Р, где [ФУ] и [Ф/4-- произволь- 
ные составные категории из вспомогательного 
словаря грамматики Г (таких категорий заведомо 
конечное число — см. стр. 125); во-вторых, правила 
вида (а) —а, где а — основной (терминальный) 
символ, а (а) — произвольное значение приписы- 
вающей функции от а. Эквивалентность построенной 
так ВС-грамматики Г и исходной К-грамматики С 
почти очевидна; мы позволим себе опустить формаль- 
ное доказательство. 

Оказывается, что верно и обратное: всякий 
КС-язык есть К-язык, причем для всякой ЕС-грам- 
матики можно построить эквивалентную ей К-грам- 
матику. 

Из сказанного непосредственно следует, что класс 
К-языков в точности совпадает с классом ВС-язы- 
ков. Поэтому вопрос о принципиальной пригодно- 
сти К-грамматик для описания естественных язы- 
ков решается так же, как для КО-грамматик (см. 
стр. 93 и сл.). Что же касается практического удоб- 
ства, то в двух очень существенных отношениях 
К-грамматики явно неудобны. 


*) Частью составной категории является любая катего- 
ия, входящая в ее состав, например, частями категории 
(ХУ ИУИХИИ[У ИЕ] являются (не считая ее самой) следую- 
щие категории: [^ХДУ/ХИ, [УХ], [7/2], Х, У, 2. 


АУ 
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1) Применение их к естественным языкам, в 0с0- 
бенности же к языкам с развитой морфологией (на- 
пример, к русскому), требует введения огромного 
количества составных категорий, и притом необы- 
чайно громоздких — ср. категории для и в примере 
на стр. 130. Что еще хуже, эти категории исполь- 
зуются весьма неэкономно: почти каждому слову, 
даже если оно не омонимично (т. е. не типа печь 
или англ. [Ю] шотё — [1е] шотк), сопоставляется 
очень много разных категорий. Мы уже говорили 
об этом применительно к форме метель (стр. 128); 
обратим внимание еще на союз и: на стр. 128 ему 
уже приписано 54 категории, однако эта группа ка- 
тегорий годится только для случая, когда и соеди- 
няет правые прямые дополнения! Для всех прочих 
многочисленных случаев (левые прямые дополне- 
ния, правые предложные группы с предлогом в, 
то же с предлогами без, на и т. п., переходные глаго- 
лы, левые определения к глаголу,..., целые предло- 
жения) со1озу и надо приписать особые группы кате- 
горий, вообще говоря, такого же объема. В резуль- 
тате союзу и будет сопоставлено несколько тысяч 
категорий. 

Очевидно, что если большинству слов сопостав- 
ляется (каждому) так много категорий, то число це- 
почек категорий для одной цепочки слов астрономи- 
чески велико. 

Обратим внимание на то, что в нашем примере 
нет прилагательных. Это не случайно: если бы при 
выбранном нами принципе введения элементарных 
категорий пришлось бы сопоставлять категории и 
прилагательным, это повело бы к еще большему уве- 
личению числа категорий на слово. Чтобы разъяс- 
нить это, нужно слишком много места; читатель 
может попытаться сам приписать прилагательным 
нужные категории в рамках предлагаемой грамма- 
тики (это потребует некоторых изменений в уже вве- 
денных категориях; основная трудность — обес- 
печить согласование прилагательных с существи- 
тельными в роде). Сходные трудности, связанные с 
приписыванием категорий английскому герундию 
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— например, в р/аутз саг4$ 15 рип- отметил И. Бар- 
Хиллел (Ваг-НШе| 1960). 

2) В К-грамматиках синтаксические категории 
слишком тесно связаны с порядком слов: левое’ и 
правос подлежащее, левое и правое дополнение — 
совершенно различные категории, что резко про- 
тиворечит интуиции. 

В то же время К-грамматики имеют три безуслов- 
ных достоинства: 

1) К-грамматики фактически не имеют правил 
(за исключением общих для всех грамматик правил 
сокращения, которых всего два). Все необходимые 
сведения о синтаксических свойствах слов содер- 
жатся здесь только в «словарных статьях», т. е. да- 
ются исключительно приписывающей функцией, 
ср. стр. 125: 

2) В-грамматика предполагает весьма тонкий 
анализ синтаксических свойств отдельных слово- 
форм, т. е. детальное различение их синтаксических 
функций. При этом для каждой «микрофункции» 
имеется отдельное эксплицитное выражение — своя 
категория. 

Обратной стороной обоих достоинств как раз и 
является громоздкость и многочисленность категорий. 

3) К-грамматика позволяет получать для фразы 
не только систему (и дерево) составляющих, но и 
систему (дерево) зависимостей *). (Подчеркнем, что 
ЕС-грамматика, вообще говоря, не дает единствен- 
ного дерева зависимостей даже для синтаксически 
однозначных предложений.) Это свойство делает 
К-грамматики интересными с точки зрения автома- 
тического анализа и перевода текстов, где удобно 
иметь возможность одновременного представления 


структуры текста и в терминах ПС, и в терминах 
зависимостей **). 


*) Относитольно обоих методов представления синтакси- 
ческой структуры см. Падучева 19646; Гладкий 1966, стр. 
8—29; Науз 1961. 

**) Ряд алгоритмов анализа текстов, основанных на тех 


или иных модификациях К-грамматик, упоминается в Вор- 
го\ 1963. 
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В то же время для подобных практических целей 
К-грамматики в чистом виде — в связи с указан- 
ными выше недостатками — по-видимому, мало 
пригодны. 


Автоматы с магазинной памятью 
(М-автоматьы) 


Прежде всего мы попытаемся дать содержатель- 
ное представление 0б автоматах с магазинной 
памятью с помощью примера. Использование мага- 
зинной памяти положено.в основу одного класса алго- 
ритмов автоматического синтаксического анализа* )— 
так называемых предсказуемостных, 
или предиктивных, анализаторов 
(П-анализаторов; Капо 1963, Капо — Оепеег 
1963, Ра: 1963). 

Ниже описывается П-анализатор не совсем та- 
кого вида, как в указанных работах. Поскольку в 
отличие от авторов этих работ мы не связаны тре- 
бованиями практического удобства обработки ре- 
альных текстов, но должны заботиться о максималь- 
ной простоте и общности изложения, оказалось це- 
лесообразным придать П-анализатору несколько 
иную форму. 

Главное отличие предлагаемого ниже варианта 
П-анализатора от «традиционных» вариантов состоит 
в том, что обычно П-анализаторы трактуют как 
алгоритмы синтаксического анализа, мы же 
рассматриваем их здесь как исчисления 
(грамматики). Иначе говоря, в обычном П-анализа- 
торе каждый шаг однозначно определяется преды- 
дущим ходом процесса, тогда как в нашем варианте 
для каждого шага имеется, вообще говоря, много 
возможностей («разрешенных вариантов»), из кото- 


*) Алгоритм автоматического синтаксического анализа — 
это система (правил), способная приписывать фразам данного 
языка их синтаксические структуры. Такие алгоритмы яв- 
ляются важнейшими частями систем автоматического пере- 
вода. Подробнее об автоматическом синтаксическом анализе 
см. Мельчук 1963; 1964, ТозЬ 1965. 
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рых можно выбирать любую (ср. замечание о соот- 
ношении грамматики и алгоритма на стр. 45—46). 

Общая идея предсказуемостного анализа заклю- 
чается, грубо говоря, в следующем. Фраза обраба- 
тывается слово за словом в одном направлении — 
слева направо. Для каждого очередного слова фор- 
мулируется «синтаксическое предсказание» (СП) — 
предсказывается, какая конструкция (составляющая) 
может следовать в данной фразе за этим словом. 
Если следующее слово удовлетворяет этому СП, 
анализ продолжается, в противном случае прекра- 
щается. Поскольку слово может предсказывать много 
разных составляющих, образуется много «дорожек» 
анализа, причем в случае синтаксически однознач- 
ной фразы анализ доводится до конца только по од- 
ной дорожке. 

В результате анализа фразе сопоставляется си- 
стема составляющих («анализ по НС»); границы со- 
ставляющей будут изображаться с помощью скобок, 
помечаемых символом этой составляющей. 

Процесс работы П-анализатора мы опишем на 
примере анализа фразы: Маленький мальчик на да- 
леком от города полустанке ждал приезда родителей. 
Для обработки этой фразы необходимо располагать 
рядом сведений о русском языке; эти сведения раз- 
мещаются в следующих двух компонентах П-ана- 
лизатора: 

1) Словарь (или словарь -- алгоритм морфоло- 
гического анализа), который сопоставляет каждой 
словоформе ее синтаксический код: часть речи, па- 
деж, род, лицо, одушевленность и т. п., например, 
для маленький — Ан,едим.вии, ДЛЯ на — РГьиитредя И 
т. д. Этот компонент — аналог приписывающей 
функции категориальной грамматики, см. стр. 125 
— характерен не только для Ш-анализатора: 
подобный словарь в том или ином виде необходим 
в любых распознающих грамматиках (а фактиче- 
ски — ив порождающих, ср. пример на стр. 57, где 
роль словаря играют правила группы [У). 

2) Специфической особенностью П-анализатора яв- 
ляются две синтаксические таблицы 
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А и © (см. стр. 139—140), содержащие все необходи- 
мые сведения о синтаксисе данного языка. 

Таблица А, описывающая возможные «начала» 
разных составляющих, имеет три столбца. 

В столбце Т перечисляются все типы составляю- 
щих *), принятые в данном описании данного языка, 
например «именная группа», «группа сказуемого», 
«предложная группа» и т. д. 

В столбце П для каждого типа составляющих 
С перечисляются все классы словоформ из, и», из... 
.... Ша, Которыми может начинаться составляющая 
данного типа, например, для именной группы в им. 
падеже — 1) наречие (очень хорошая книга), 2) Ацы 
(маленький мальчик), 3) 9Эим (таблица) и т. д. 

И наконец, в столбце ПТ содержатся сами син- 
таксические предсказания (СП). А именно, для каж- 
дой пары <С, ш,> указывается, какие составляю- 
щие (одна или несколько) могут следовать за и, 
внутри составляющей С. Например, одним из син- 
таксических предсказаний для словоформы типа 
приезд, прыжок и т. п., начинающей «именную груп- 
пу», будет «именная группа в род. пад», что содер- 
экательно означает следующее: такая словоформа 
способна иметь дополнение в род. падеже в отличие, 
например, от он или нас, при которых именной 
группы в род. падеже вообще быть не может. Среди 
СП для прилагательного, начинающего именную 
группу, есть «предложная группа -- именная груп- 
па» (см. табл. А, строка 3): это означает, что именная 
группа может иметь строение «прилагательное -- 
- предложная группа -- именная группа», например, 
трудная | для нас |- алгебраическая задача. 

Для каждой пары <С, ш,> имеется, вообще говоря, 
несколько альтернативных синтаксических предска- 
заний: например, после словоформы приезда в со- 
ставе именной группы может пепосредетвенно следо- 
вать либо предложиая группа (приезда в Москву), 


*) За исключением составляющих, равных отдельной 


словоформе («атомарных» составляющих) или целому предло- 
жению. 
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Синтаксическая таблица А 


п 


ом” т 
ор состав Клас аа  биитаксические Прим ры 
ки ляющая формы прэдсказания 
1. ИГ... | 4 ГОхии,з + Очень малень- 
, -- ИГх,ч, кий мальчик... 
2. ИР, | Аж ИГх, у, Маленький 
мальчик... 
3. ИГ | Ах ПГ ++ ИГх,у,г | Бледное — от 
усталости ли- 
о... 
4. ИГ. у, 2 | хил ПГ Дом мезопци- 
ном . 
5. ИГ, у, ху ИГ род Сын наших 
'` старых соседей 
6. ГО», у, 2 Ах ПР Близкий в 
окончанию... 
7. ПГ Рг; ИРх, 2 На зеленом 
, лугу . 
8. ГР ую И ГР, ур Давно мечта- 
ет ... 
9. ГГхур | РГ ИГ’ ли, и + На голой вер- 
и ГЕРх, у ш шине стоит 
10. РР у У ху ПГ . . стоит 
за углом 
44. | ГРуию | Ухиье ИГ,, Си”. ждет 
билетов 


12. | ГГхирь | Ухугии | ИГ, + ИГ» |... дает би- 
лет подруге 


Пояснения к обозначениям (в таблицах А и О): 


ИГ — именная группа, Рг, — предлог, требующий па-| 
дежа 2, 
ПГ — предложная группа, Г, — глагол, требующий до- 
полнепия в падеже 2’, 
ГГ — глагольпая группа, У,,.„— глагол, требующий двух 
ГО — группа определепия, дополнений: в падеже = и в 
падеже =”. 


Остальные обозна“ения имеют тот ке смысл, что и выше, 
стр. 57. 


либо именная группа в родительном падеже (приезда 
алжирских студентов), либо придаточное с который, 
а также может ничего не следовать. 
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Синтаксическая таблица А (как и таблица ©), 
носит сугубо иллюстративный характер и вовсе не 
претендует на сколько-нибудь адекватное представ- 
ление русского синтаксиса; достаточно полная 
таблица А должна быть во много раз больше (синта- 
ксическая таблица для русского языка, приведен- 
ная в Р]а11 1963, имеет 2344 строки и гораздо более 
сложное строение). 

Следует иметь в виду, что, как и раньше (ср. стр. 
55), здесь использованы сокращенные обозначения 
с помощью переменных индексов. Таким образом, 
каждая строка таблицы А (и таблицы @) фактически 
является записью многих строк. 

Таблица © описывает возможные «концы» раз- 
ных составляющих и имеет всего два столбца. 

В столбце Т, как и в таблице А, перечисляются 
все типы составляющих, кроме атомарных. 

В столбце П для каждого типа составляющих С 
перечисляются все классы словоформ (в нашем при- 
мере приводятся не все!), которыми составляющая 
данного типа может оканчиваться, например, для 
«именной группы» — 5 ит. п. 

В нашем примере таблица © имеет следующий вид: 


Синтаксическая таблица © 


п 


т Класс замыка- п . 
Составляющая ющей словофор- рим?ры 
МЫ 
р 
1. ИГх, у, т .. . берег с небольшим 
лесочком 
2. ГОхи, риа . важные для чита- 
теля . 
3. ГОхн, 2 Ах, у, .. .давно забытый . 
4. ху, .. . На зеленом лугу. 
5. ГГх,у Ух, у .. .убердно работает. 
6. ГГх,у 5 ку," .. . работает над книгой. 
’ ) 
7. ПРЕДЛ 5 х,,2 Лодка колотится в сон- 
ной груди. 
8. ПРЕДЛ Ух,у Сердце с домом разлуча- 


ется. 


В 
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Кроме обоих описанных компонентов, содержа- 
щих все необходимые сведения о синтаксисе данного 
языка, П-анализатор имеет еще третий, наиболее 
существенный компонент — особым образом орга- 
низованную «рабочую зону», называемую накопите- 
лем синтаксических предсказаний (НСП). В отли- 
чие ог словаря и обеих синтаксических таблиц, ко- 
торые используются как пассивные справочники 
(их содержимое в процессе анализа не меняется), 
ПСП есть именно то место, где происходит перера- 
ботка всех промежуточных результатов. НСПИ со- 
стоит из неограниченного числа магазинов*), 
которые можно представлять себе как устройства, 
аналогичные винтовочному магазину или автомату, 
подающему бутерброды: в магазин можно вводить 
(записывать) только по одному символу и только с 
одного конца, скажем, сверху, и только с того же 
конца можно «вынимать» символы из магазина (сти- 
рать их), так что символ, введенный в магазин по- 
следним, вынимается из него первым (а -шт-Нгз(- 
01% ргпс1 ре); при этом магазин устроен так («снаб- 
жен подающей пружиной»), что, когда в него вводится 
новый символ, все символы, бывшие там ранее, опус- 
каются вниз («утапливаются»), а когда верхний символ 
стирается (вынимается), остальные символы автома- 
тически подымаются на шаг вверх (рис. на стр. 142). 

Теперь мы можем перейти к изложению самого 
процесса анализа фразы с помощью П-анализатора. 

Прежде всего следует подчеркнуть, что как в 


силу грамматической неоднозначности многих 


*) Это означает, что данный П-анализатор имеет потенци- 
ально бесконечное множество магазинов, т. е. сколько бы ма- 
газинов ни понадобилось в процессе анализа, столько их и 
можно иметь в распоряжении. Нужное количество магазинов 
зависит от длины и синтаксических особенностей фразы: 
каждый магазин соответствует одному варианту анализа, 
причем отдельные магазины в принципе нужны не только для 
правильных (доходящих до конца фразы) вариантов, но и для 
неправильных (обрывающихся где-то по дороге). 

Сами магазины также считаются имеющими пеограни- 
ченную вместимость, что связано с фундаментальным допу- 
щением о неограниченности длин фраз естественного языка 
(см. стр. 59—60). 
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словоформ (печь — ТУ // 9 им-вин, ЛИНИИ — Эн, им-вин/ 
5 ед,род/Юед,преди И Т.Д.), так и в силу наличия у слово- 
формы в большинстве случаев нескольких СП каждый 
шаг анализа допускает, вообще говоря, более одного 
продолжения. Это приводит ко многим вариантам, 
или «дорожкам», анализа. 

Однако в некоторых вариантах возможна ситуа- 
ция, когда на некотором шаге не оказывается ни 
одного допустимого продолжения, а обработка 


д) Исрных 6) ИР 6 ИГИИХ. 6/ ИЗЬЯИРИР АЯ АСТИ. 


МОРЕ ПАЙ ЩОРС РЯ МЕРОЗОРИ 
2720 СЕРИЯ ИВА ИЯ 


фразы еще не закончена. Это означает, что либо ана- 
лизируемая фраза синтаксически неправильна, 
либо (если она правильна) на одном из предыдущих 
шагов было выбрано «нежелательное» продолжение, 
что завело анализ в тупик. Таким образом, правиль- 
ность дорожки (т. е. варианта анализа) сигнализи- 
руется достижением конца фразы, неправильность — 
невозможностью дойти до конца фразы. 

Каждой дорожке отводится один магазин. Этот 
магазин играет роль памяти (отсюда и название 
«автоматы с магазинной памятью»), в которой хра- 
нятся синтаксические предсказания, соответствую- 
щие данной дорожке. 

При рассмотрении примера мы проследим только 
одну дорожку анализа, соответствующую правиль- 
ному синтаксическому толкованию приведенной на 
стр. 137 фразы (эта фраза имеет и другое правиль- 
ное толкование, см. ниже стр. 147). 
°— До начала анализа перед первым подлежащим об- 
работке словом открывается скобка с пометкой 
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«ПРЕДЛ», а в магазины помещаются предсказа- 
ния ИГы ед. им -- ГГи,сд.з |- ПРЕДЛ (табл. 0 на 
стр. 146), поскольку а рг1от1 можно предполагать, 
что анализируемый отрезок представляет собой пред- 
ложение (ПРЕДЛ) и состоит из группы подлежа- 
щего (ИГим) и группы сказуемого (ГГ), причем ИГьм 
стоит левее, чем ГГ. Это предположение, разумеется, 
не единственное; в другие магазины могут быть поме- 
щены иные априорные наборы предсказаний — хотя 
бы на подлежащее (и, соответственно, сказуемое) 
женского или среднего рода или множественного чис- 
ла, — которые, однако, для нашей фразы не дадут 
правильных анализов. 

Каждый шаг анализа состоит в обработке одного 
слова. Эта обработка складывается из следующих 
операций (напоминаем — ср. стр. 136, — что здесь 
дается не алгоритм анализа, а набор разрешен- 
ных операций, так что на каждом шаге можно 
выполнять любое из возможных в этом случае дей- 
ствий): 

1. Сравнить синтаксический код слова с рабочим 
(верхним) предсказанием в магазине, т. е. искать со- 
ответствующую пару в таблице А и тем самым прове- 
рить, может ли данное слово начинать предсказан- 
ную составляющую. Если нет, продолжение анализа 
невозможно. 

2. Если да, начало этой составляющей отмечается 
левой скобкой, и дальше можно делать одно из двух: 

2а. В предположении, что начатая составляющая 
продолжается, выбрать одно (любое) из СП рабочего 
слова, поместить его в магазин (поверх хранящихся 
там предсказаний) *) и перейти к следующему ша- 
гу, т. е. к очередному слову. 

26. В предположении, что начатая составляющая 
заканчивается рабочим словом, искать в таблице 
< пару «рабочее СШ, синтаксический код рабочего 
слова} и тем самым проверить, может ли данное 


*) сли это СП состоит более чем из одной сиптаксичес- 
кой группы (см. столбец ТП таблицы А, строки 1, 3, 9 и 12), 
то группы помещаются в магазин справа налево, так что са- 
мой.верхней оказывается самая левая группа. 
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слово заканчивать эту составляющую. Если нет, про- 
должение анализа невозможно. Если да, конец со- 
ставляющей отмечается правой скобкой и соответст- 
вующее (рабочее) СП убирается из магазина. Опера- 
ция 26 может быть повторена сколько угодно раз 
(поскольку рабочее слово может заканчивать не толь- 
ко данную составляющую, но и более крупную, ко- 
торая была начата ранее и включает данную); затем 
следует переходить к очередному шагу анализа. 

Анализ считается законченным, а результат его 
правильным, если после обработки последнего слова 
фразы магазин оказывается пустым. Итак, начинаем 
описание анализа нашей фразы. 

1-й шаг. Рассматриваем слово маленький; рабо- 
чее (верхнее в магазине) СП = ИГь ед, им. Поскольку па- 
ра <ИГыедим, Амедим › есть в табл. А (строки 2, 3), 
мы заключаем, что словоформа типа маленький 
может начинать предсказанную составляющую. Слта- 
вим перед маленький левую скобку, помеченную сим- 
волом «ИГу слим», и выбираем путь 2а, т. е. берем 
в столбце ТГ одно из СП данной пары, а именно 
ИГ» едим, и помещаем его в магазин; теперь мага- 
зин будет содержать предсказания ИГуедим -Е 
—- ИГь ед.им-- ГГыед.з-^ ПРЕДЛ (см. табл. 1, стр. 146). 

2-й шаг. Рабочее слово — мальчик, рабочая па- 
ра — <ИГы едим, Эм.едим,». Эта пара содержится в 
табл. А (строки 4, 5), и мы, поставив перед мальчик 
соответствующую скобку, выбираем на этот раз путь 
26: ищем рабочую пару в таблице ©, найдя се там 
(строка 1), ставим после мальчик правую скобку 
(«ИГиед.им”) и убираем рабочее предсказание из 
магазина. Повторяем операцию 26 еще раз: снова 
находим в © рабочую пару <ИГыедим, Эм,ед.им», 
ставим после мальчик еще одну скобку с пометкой 
«ИГы вл. им», Убираем из магазина верхнее предска- 
зание и переходим к очередному слову. 

После 2-го шага наша фраза имеет вид 


01 2 2 2 
( (ЛМаленький (мальчик ) ) 
ПРЕДЛ ИГ, ед, им ИГЬ, ед, им ИГ, ед, им ИГ. ед, им 
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на далеком от города... (цифра над скобкой означа- 
ет номер шага, на котором эта скобка появилась), 
а магазин имеет вид 26 на стр. 146. 

3-й шаг. Рабочее слово — на, рабочая пара — 
«ГГыед,з, РГпрздл»; Она есть в таблице А (строка 9). 
Открываем левую скобку глагольной группы и берем 
одно из имеющихся в табл. А СП этой пары: 
ИГЬ ед, предл -- ГГм.ед,з, Которое помещается в магазин 
(табл. 3). 

4-й шаг. Рабочее слово — далеком, рабочая па- 
ра — <ИГЬь ед ‚предл, Ам.ед.предл». Найдя ее в табли- 
це А, открываем перед далеком скобку с пометкой 
«ИГы,ед, предл» И в качестве очередного СП выбираем 
ПГ-+- ИГЬь ед, предл (строка 3); магазин приобретает вид 
табл. 4. 

5-й шаг. Рабочее слово — от, рабочая пара — 
‹ПГ, Ргрод». Поскольку она есть в табл. А, ста- 
вим перед от левую скобку («ПГ») и помещаем в 
магазин СП данной пары (строка 7); теперь магазин 
содержит предсказания (сверху вниз): ИГ, ед, род -+ 
ПГ - ИГь, ед, предл Е ИГь ед, предя- ГГы,2д 8 ГГы,ед,3 -- 
-- ПРЕДЛ (табл. 5). 

6-й шаг. Рабочее слово — города, рабочая пара— 
<«ИГ,, ед, род» Юм‚ед.род». Эта пара есть в табл. А; открыва- 
ем перед города скобку («ИГь сд, род»), но вместо пути да, 
как на шагах 3—5, выбираем путь 26. Найдя рабо- 
чую пару в табл. 9, закрываем скобку после 
города и убираем рабочее предсказание ИГь,ед.род из 
магазина (табл. ба); затем повторяем операцию 26 еще 
раз: новая рабочая пара <ПГ, Быед.тод» содержится 
в табл. @ (предложная группа может оканчивать- 
ся существительным), поэтому ставим после города 
еще одну правую скобку, теперь с пометкой ПГ, и 
убираем рабочее СП из магазина (табл. 66), после 
чего переходим к очередному слову. 

Оставшиеся шаги (7—10) читатель может выпол- 
нить сам; чтобы облегчить ему эту задачу, мы приве- 
дем состояния магазина после каждого из шагов 
7—10 (табл. Та — 10д) и фразу в том виде, ка- 
кой она должна иметь после завершения анализа 
(цифра над скобкой — это номер шага, на котором 
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появилась данная скобка; цифра под скобкой — 
сокращенное обозначение типа группы): 


01 2 223 4 5 6 66 
( (маленький (мальчик) ) (на (далеком (от (города )) 
12 2 223 4 5 6 65 
7 7178 9 9 1040401010 
(полустанке) ) (ждал (приезда (родителей) ) ) ) ) 
4 443 6 7 76331 


Обозначения типов групп: 
1— ПРЕДЛ 4— ИГЬ, сд, предл 
2 — ИГу едим 5 — ПГ 
3 — ГГь, ед‚з 


Состояния магазина: 


6 — ИГ, ед, род 
и — ИГ, мн‚род 


0 1 23 
ИГ, ед, им ИГ, ед, им ИГ, ед, им 
ГГы, ед, 3 м. ед, им м, ед, 3 
ПРЕДЛ ТГи. ед, 3 ПРЕДЛ 
ПРЕДЛ 
26 3 4 
ГГи, ед, 3 ИГЬ, ед, предл т 
ПРЕЦПЦЛ ГГы, ед, 3 И м, ед, предл 
м, ед, 3 ИГы, ед, пр?дл 
ПРЕДЛ м, ед, 3 
м, ед, 3 
ПРЕДЛ 
5 ба 66 
ИГы, ед, род на ИГы, ед, предл 
Г -_М» ед, предл м, ед, предл 
ИГЬ, ед, предл м, ед, прэдл м, ед, 3 
ИГы, ед, предл -м, ед, 3 м, ед, 3 
м, ед, 3 м, ед, 3 ПРЕДЛ 
м, ед, 3 ПРЕДЛ 


ПРЕДЛ 
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Та 76 5 
ИТ, ед, предл ГГ ед, 3 ИТы, ед, род 
ГГы, ед, 3 ГГы, сд, 3 ГГы, ед, 3 

м, ед, 3 ПРЕДЛ ГГ, ед, 3 
ПРЕДЛ ПРЕДЛ 

9 10а 106 
ИГЬы, ми, род ИГы, ед, род ГГи, ед, 3 

м, ед, род м, ед, 3 м, ед, 3 

м, ед, 3 м, ед, 3 ПРЕДЛ 

ы, ед, 3 ПРЕДЛ 

РЕДЛ 

ЧОв 10г 10д 
ГГы, ед, 3 ПРЕДЛ 
ПРЕДЛ 


Таким образом, получается вполне обычное пред- 
ставление НС-структуры, правда, с одной несущест- 
венной особенностью: атомарные составляющие 
(индивидуальные словоформы), начинающие более 
крупные составляющие, не заключаются в скобки. 
Это связано со спецификой работы П-анализатора. 
а именно с тем, что он обрабатывает фразу только 
слева направо. 

Заметим, что наша фраза имеет и другую синтак- 
сически правильную интерпретацию: ( (Маленький 
(мальчик (на (далеком (от (города) ) (полустанке))))) 
(ждал (приезда (родителей)))), т.е. группа на... 
полустанке относится не к группе сказуемого, а к 
группе подлежащего (мальчик на полустанке, а не 
ждал на полустанке). Хотя такая интерпретация 
семантически вряд ли приемлема, синтаксически она 
вполне законна и должна выдаваться П-анализато- 
ром. В нашем примере анализа мы могли бы полу- 
чить эту интерпретацию, если бы на 2-м шаге мы 
выбрали путь 2а, а не 26, и при этом взяли бы из 
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таблицы А предсказание ПГ (строка 4). Рекомен- 
дуем читателю провести анализ по этому пути само- 
стоятельно. 

С формальной точки зрения П-анализатор пред- 
ставляет собой частный случай так называемого 
автомата с магазинной памятью (М-автомата). Дать 
точное определение М-автомата в рамках настоящего 
изложения, не рассчитанного на читателя, знакомого 
с теорией алгоритмов, слишком сложно, поскольку 
для его понимания фактически требуется знание 
машин Тьюринга. Для подготовленного читателя 
это определение приводится ниже мелким шрифтом. 


Недетерминированная машина Тьюринга *) называется 
М-автоматом, если она удовлетворяет следующим усло- 
виям: 

1. Машина имеет три ленты (называемые соответственно 
входной, рабочей и выходной) и три головки, по одной на 
каждой ленте. Все три ленты ограничены слева и неограниче- 
ны справа. 

2. Машина имеет три внешних алфавита: входной — 
для входной ленты (содержательно — основной словарь), 
рабочий — для рабочей ленты (содержательно — набор 
синтаксических предсказаний -- «пустой символ») ивы ход- 
ной (содержательно — набор левых и правых скобок, по- 
меченных символами типов составляющих, -- «пустой сим- 
вол»). 

3. Машина может производить следующие элементар- 
ные операции: 

а) На входной ленте — только читать символ, записан- 
ный в обозреваемой ячейке, и сдвигать головку на одну ячей- 
ку вправо. 

6) На рабочей ленте— либо писать в обозреваемой ячей- 
ке (непустой) символ и сдвигать головку на одну ячейку 
вправо, либо сдвигать головку на одну ячейку влево 
и стирать записанный в ней символ. (Таким образом, рабо- 
чая лента всегда имеет вид, показанный на стр. 149.) 

Из этого рисунка видно, что рабочая лента есть не что 
иное, как магазин. 

в) На выходной ленте — только записывать символ и 
сдвигать головку на одну ячейку вправо. (В результате 
работы машины на выходной ленте должно выписываться 


*) Недетерминированная машина Тьюринга отличается 
от обычной машины Тьюринга только тем, что в ее программе 
могут быть различные команды с тождественными левыми 
частями. 


Т.з 


Т,. 
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скобочное представление системы составляющих для анали- 
зируемой фразы.) 

г) На каждом шаге машина работает только на одной 
ленте. 

д) В начальный момент все три головки находятся в 
крайних левых ячейках соответствующих лент, рабочая и 


Ивловие 
^ Аепуатые и |, _ Пири | 


выходная ленты пусты. Работа машины считается закончен- 
ной, если головка на входной ленте дошла до первой пустой 
ячейки, а. рабочая лента в этот момент пуста. 


Читатель, знакомый с машинами Тьюринга, без 
труда сообразит, что П-анализатор соответствует 
М-автомату, на который наложено следующее до- 
полнительное ограничение: перед каждой записью 
символа на рабочую ленту машина должна читать 
символ на входной ленте. (Содержательно это огра- 
ничение объясняется тем, что помещение синтакси- 
ческого предсказания в магазин П-анализатора 
всегда непосредственно обусловливается прочтением 
очередного слова фразы.) Заметим еще, что М-авто- 
мату разрешается писать за один шаг на рабочей лен- 
те только один символ, тогда как П-анализатор иногда 
пипет сразу несколько символов; очевидно, что 
это различие не принципиально. 

Для каждого М-автомата можно рассматривать 
множество, состоящее из всех тех и только тех це- 
почек (отрезков текста), которые он способен проа- 
нализировать, — язык, определяемый М-автоматом, 
или М-язык (ср. понятие ВК-языка, стр. 132). Докала- 
но, что 

а) для каждого М-автомата можно ‘построить 
эквивалентную ему КС-грамматику; 

6) для каждой КС-грамматики можно построить 
эквивалентный ей М-автомат, т. е. М-автомат, опре- 
деляющий тот же язык. 
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Таким образом, класс М-языков совпадает с клас- 
сом КС-языков (а тем самым в силу теоремы Т,., 
стр. 133, с классом К-языков). 


О значении этого факта уже говорилось выше, 
стр. 93—94. 


Е вопросу о классификации грамматик 


Закончив обзор осповных типов грамматик, мы 
можем теперь высказать следующее соображение 
относительно их классификации. В литературе по 
математической лингвистике грамматики всегда 
подразделяют на порождающие и распознающие; 
этой принятой классификации придерживались и 
авторы данной книги, хотя она представляется им 
в значительной мере условной. 

В самом деле, прежде всего легко видеть, что по- 
рождающие грамматики наиболее важного типа, а 
именно, неукорачивающие (и, в частности, НС-грам- 
матики), могут быть использованы также и для рас- 
познавания, т. е. для отличения грамматически 
правильных (выводимых) предложений от непра- 
вильных (невыводимых). Это фактически было дока- 
зано на стр. 50—-53. Для произвольных грамматик 
такая ситуация не имеет места: существуют грамма- 
тики, для которых алгоритм распознавания выводи- 
мости цепочек невозможен (ср. первую сноску на 
стр. 50). Однако суть дела в том, что порожде- 
нию естественно противопостав- 
ляется не распознавание, а, так 
сказать, «допускание». Именно, естест- 
венно говорить, что некоторая грамматика Г до- 
пускает язык С, если Г дает процедуру, способную 
для любой цепочки х, принадлежащей Г, рано или 
поздно установить это (т. е. установить, что Е Г); 
если же х не принадлежит С, то от этой процедуры 
‚ничего не требуется: она может либо обнаружить, 
что 2 6 Г, либо не дать вообще никакого результата, 
т. е. продолжаться вечно. (Напомним, что от рас- 
познающей процедуры требуется больше: она долж- 
на давать результат в любом случае — положи- 
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тельный, если хСАХ, и отрицательный, если 
хЕГ.) 

Если вместо распознавания рассматривать «до- 
пускание», то тогда все порождающие грамматики 
могут трактоваться и как допускающие. При этом 
допускающая процедура состоит просто в том, что 
правила грамматики применяются к данной цепочке 
«наоборот» — справа налево: в цепочке отыскива- 
ется вхождение правой части некоторого правила и 
заменяется левой частью, и этот процесс продол- 
жается, пока можно. Допускаемыми цепочками бу- 
дут в. точности те, которые могут быть свернуты 
указанным процессом к начальному символу; ясно, 
что это как раз те самые цепочки, которые при 
«обычном» использовании грамматики выводятся 
из начального символа. 

С другой стороны, распознающие грамматики 
(которые заведомо являются и допускающими) 
могут использоваться и для порождения. Так, что- 
бы с помощью категориальных грамматик можно 
было порождать цепочки, достаточно переформули- 
ровать правила сокращения как правила разверты- 
вания (т. е. фактически просто прочитать их наобо- 
рот): 1) всякую категорию ЧФ можно развернуть 
в ФФ\], где Ф — произвольная категория 
(левое развертывание), 2) всякую категорию Ф 
можно развернуть в [Ф/ИЧУП, где Ч — произволь- 
ная категория (правое развертывание). Легко соуб- 
разить (читатель, по-видимому, без труда сделает это 
сам), как будет тогда осуществляться процессе по- 
рождения. Ср. стр. 133. 

Что же касается М-автоматов, то излагать способ 
использования их для порождения мы не будем; 
для нас здесь важно лишь, что это, безусловно, 
можно сделать. 

Таким образом, формальные грамматики по су- 
ществу нейтральны по отношению к порождению и 
допусканию (а также распознаванию, если оно воз- 
можно). Можно полагать, что было бы целесообраз- 
но говорить не о порождающих и распознающих 
(допускающих) грамматиках, а просто о граммати- 
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ках, рассматривая аспект «направление примене- 
ния» (для порождения или допускания) отдель- 
но от определения самих грамматик. Тогда 
конкретная грамматика будет трактоваться как 
«грамматика такого-то класса в таком-то аспекте», 
например, «допускающая НС-грамматика», «по- 
рождающий М-автомат» и т. п. 

Обычное деление грамматик на порождающие и 
распознающие имеет естественное историческое 
объяснение. Те грамматики, которые называют по- 
рождающими (соответственно  распознающими), 
разрабатывались с целью использовать их как раз 
для порождения (распознавания). Однако, как мы 
только что видели, независимо от цели создания 
грамматики она может использоваться «в обе сто- 
роны». Поэтому противопоставление «порождающие/ 
/ распознающие» представляется недостаточно от- 
ражающим существо дела. 

Более глубоким, как нам кажется, является 
различие В способе задания 
информации о синтаксической 
сочетаемости: эта информация содержится 
либо в правилах (любого вида), либо в словаре, т. е. 
в синтаксических кодах отдельных слов (в последнем 
случае правила тоже нужны, но их сравнитель- 
но немного и притом они не содержат никакой 
информации о конкретном языке; ср. два правила 
сокращения К-грамматик). На этом различии может 
основываться подразделение грамматик на два глав- 
ных класса: грамматики с правилами (ге отаттагз; 
к сожалению, невозможен термин «правильные грам- 
матики») и грамматики без правил (ги[е]езз отаптагз, 
«бесправильные грамматики»). К первому классу 
относятся грамматики Хомского и М-автоматы (для 
последних роль правил играют синтаксические 
таблицы А и 4), ко второму — К-грамматики 
(ср. стр. 123). 

Ни тот, ни другой класс не исчерпываются наз- 
ванными типами грамматик; новых типов, однако, 
мы привлекать здесь не будем, а ограничимся теми, 
которые рассматривались в $$ 2—6. 
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В заключение заметим, что речь идет здесь не 
просто о новой классификации, но скорее о новом 
аспекте рассмотрения грамматик. Обычно в поня- 
тие грамматики неявно включается и способ ее ис- 
пользования, хотя в формальных определениях 
грамматик он не фигурирует; предлагается же, как 
уже было сказано выше, полностью отделить этот 
способ от самого понятия грамматики. Вместе с тем 
на первый план выдвигается способ подачи инфор- 
мации о конкретном языке; эта особенность грамма- 
тик отражается в их определениях. 


«Логический анализ языка» 


Все рассматривавшиеся нами до сих пор модели 
языка — формальные грамматики — фактически 
имели дело только с одним, хотя и исключительно 
важным, аспектом естественного языка: с синтакси- 
сом в широком смысле этого слова, т.е. с правилами 
комбинирования некоторых исходных единиц друг 
с другом в тексте. Синтаксис в широком смысле 
включает в себя как синтаксис в традиционном линг- 
вистическом понимании, т. е. законы построения 
словосочетаний из слов, предложений из словосоче- 
таний и т. п., так и морфологию, т. е. законы пост- 
роения словоформ из морф. Разумеется, различение 
морфологии — «действует внутри слова» — и соб- 
ственно синтаксиса — «действует вне словах — 
вполне целесообразно и даже необходимо. Однако 
с более общей точки зрения их удобно объединять 
вместе и называть «синтаксисом в широком смысле», 
что здесь и делается. 

Иначе говоря, формальные грамматики задают, 
как уже указывалось выше, стр. 106, только пра- 
вила образования языковых выражений. 

Однако у языка есть и другой, не менее важный 
аспект: семантика, для описания которой необходи- 
мо ввести в рассмотрение правила перехода от одних 
выражений языка к некоторым другим выражени- 
ям, несущим ту же информацию (имеющим тот же 
смысл), т.е. правила преобразования 
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языковых выражений, ср. стр. 107. Смысл языкового 
выражения рассматривается здестъ как то общее, что 
имеется у данного выражепия и всех других сино- 
нимичных ему выражений того же или какого-либо 
другого (не обязательно естественного) языка. 
Иными словами, смысл есть инвариант синонимич- 
ных преобразований (ср. положение Р. О. Якобсона 
о том, что означающее  — это то, что воспринимается, 
а означаемое — это то, что переводится). При таком 
подходе описать семантику некоторого естественного 
языка Г, означает: 1) указать другой язык Г”, на ко- 
торый будут переводиться выражения языка Г, 
и 2) задать правила перевода любых выражений с 
Г, на Г/ и обратно. Для практических целей, в част- 
ности для изучения семантики иностранного языка, 
в качестве Г” обычно берется какой-либо другой 
естественный язык, например родной язык учащего- 
ся. Если же речь идет об описании семантики языка 
в научных теоретических целях, то Г”, очевидно, . 
не может быть естественным языком: научное опи- 
сание предполагаег максимальную логическую 
четкость, эксплицитность и однозначность, а в этом 
отношении ни у одного естественного языка нет су- 
щественных преимуществ перед другими. Поэтому 
для научного описания семантики естественного язы- 
ка язык /// должен быть сконструирован специально 
и, как полагают авторы, удовлетворять по крайней 
мере следующим четырем требованиям: 

1. Все элемепты Г’ должны находиться в одно- 
однозначном соответствии с обозначаемыми сущно- 
стями — исключается не только явная омонимия 
типа лук, (оружие) — лук, (овощ) или глава, (в кни- 
ге) — глава, (семейства), но и полисемия, как, на- 
пример, в допускать: допускать, (к документам) — 
— допускать. (много решений, о задаче). Для 
всех подобных случаев в Г” необходимо иметь разные 
элементы. С другой стороны, скажем, отношение 
«субъект — действие», которое в естественных язы- 
ках может оформляться многими способами 
(ср. шлейтеровская формулировка — формулировка 
Шлейхера — формулировка Шлейлхером [закона] — 
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Шлейхер формулирует. [закон] и т. п.), в Г” должно 
иметь одно обозначение. 

2. [/^ должен иметь достаточно возможностей 
(быть достаточно богатым) для описания смыслового 
содержания любых выражений языка Г, или хотя 
бы его существенного фрагмента. При этом Г/” не 
должен иметь обязательных смысловых категорий — 
таких, употребление которых навязывалось бы его 
собственными правилами, наподобие числа сущест- 
вительных и времени глаголов в русском языке (по- 
русски невозможно построить фразу, где существи- 
тельные были бы вообще «без числа», а глаголы — 
«без времени») или кванторов в языке логики преди- 
катов (при стандартном употреблении этого языка 
переменные в правильных формулах обязательно 
должны быть связаны кванторами *)). Наличие в 
[/ своих обязательных категорий вносило бы, по- 
видимому, искажения в`картину семантики изучае- 
мого языка. Разумеется, Г” должен иметь средства 
для выражения всех понятий, связанных с числом 
или временем, но употребление этих средств не долж- 
но быть обязательным, подобно тому как в русском 
языке можно выражать размер или цвет предметов, 
но делать это не обязательно. 

3. Г’ должен обладать достаточной, но не чрезмер- 
ной «разрешающей способностью»: в нем должны 
быть выразимы все те смысловые различия, имею- 
щиеся в Г, которые интуитивно представляются 
нам существенными; в то же время Г," не должен раз- 
личать больше, чем различается в Г: ведь Г,” служит 
не для усовершенствования языка СД, а для его опи- 
сания. Заметим, что при изучении семантики естест- 
венных языков исследователи — по большей части 
философы и логики — обычно концентрируют свое 
внимание на том, как бы не упустить какие-либо 
различия, забывая, что пе менее опасно вносить 


*) Фактически часто допускаются формулы, содержащие 
свободные, т. е. не связанные квантором, переменные; однако 
в таких случаях, как правило, подразумевается квантор 
всеобщности (т.е. используется «нулевое» обозначение кван- 
тора). - 
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лишние различия, идущие от логики, а не от языко-. 
вого материала. 

4. Язык Г/ должен быть совершенно формальным, 
т.е. он должен быть задан каким-либо четким и аб- 
солютно явным способом, например, с помощью по- 
рождающей грамматики. 

Язык, удовлетворяющий перечисленным требо- 
ваниям, можно назвать семантическим языком. Та- 
ким образом, модель естественного языка, ориенти- 
рованная на его семантический аспект, есть 
некий `семантический язык плюс правила перевода с 
этого семантического языка на естественный и 
обратно. 

Построение конкретных семантических языков 
и правил перевода вряд ли следует относить к самой 
математической лингвистике, как не относится к 
ней, например, и разработка конкретных порождаю- 
щих грамматик для конкретных языков: математи- 
ческая лингвистика занимается лишь общей теорией 
грамматик, изучением их абстрактных свойств. 
Аналогично этому в математическую лингвистику 
должна была бы входить только общая теория се- 
мантических языков. 

Однако такой теории в настоящее время еще не 
существует. Более того, хотя ее разработка представ- 
ляется чрезвычайно важной как в теоретическом, 
так и в прикладном плане, авторам неизвестны рабо- 
ты, ведущиеся в соответствующем направлении. Не 
существуст пока что и готовых семантических язы- 
ков, во всяком случае — достаточно полных. Од- 
нако можно указать ряд частичных семантических 
языков, построенных для моделирования весьма уз- 
ких и очень специальных фрагментов семантики 
(см. ниже, стр. 161 —162). Поскольку эти языки яв- 
ляются базой и для разработки полных семанти- 
ческих языков, и для построения теории этих послед- 
них, стоит, по-видимому, сказать о них несколько 
слов. 

Классическим примером частичного семантиче- 
ского языка является язык логики предикатов. По- 
следующие замечания рассчитаны на читателя, уже 
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знакомого с этим языком *), поскольку описывать 
здесь этот язык было бы нецелесообразно. Однако 
ввиду исключительной важности этого языка для 
общей культуры мышления, особенно для построе- 
ний, связанных с естественным и другими искусст- 
венными языками (именно язык логики предикатов 
фактически лежит в основе известных авторам час- 
тичных семантических языков), мы настоятельно ре- 
комендуем читателю, еще не овладевшему языком 
логики предикатов, сделать это. По существу это 
совсем несложно и не требует особой математической 
подготовки; однако возможны затруднения в свя- 
зи с отсутствием элементарных и доступных руко- 
водств (на русском языке). Впрочем, можно посове- 
товать обратиться к Гильберт — Аккерман 1947, 
Тарский 1948 или Мепае]зоп 1964. 

Язык логики предикатов — основной аппарат 
математической логики — обладает высокой сте- 
пенью формализации и очень хорошо изучен. Сам 
по себе он предназначен для описания весьма огра- 
ниченной части семантики, а именно той, которая 
имеет дело с истинностью или ложностью утвержде- 
ний. Тем не менее его элементы — логические связ- 
ки, кванторы и, в особенности, сами предикаты — 
допускают более широкое использование. Этим и 
объясняется тот факт, что большинство попыток 
формального описания семантики естественных язы- 
ков связано с применением языка логики предикатов 
или хотя бы его составных частей. 

Подобные попытки можно разделить на два типа. 
К первому относятся исследования, в которых есте- 
ственные языки сопоставляются с языком логики 
предикатов с целью обнаружить в них единицы и 
категории, аналогичные единицам и категориям это- 
го последнего, т. е. выяснить, как выражаются в 
естественных языках логические категории. Эти 
работы обычно и объединяют под общим названием 


*) Здесь имеется в виду знакомство именно лишь с язы- 
ком логики предикатов, а не с ней самой: знания каких-либо 
теорем математической логики не требуется. 
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«логический анализ языка». К сожалению, исследо- 
вания в области логического анализа языка, очень 
важные и перспективные по своему направлению, 
представляют собой, как правило, отдельные наблю- 
дения и соображения, нередко очень глубокие, но 
не образующие единой связной теории. (Это, воз- 
можно, объясняется тем, что логическим анализом 
языка до последнего времени занимались по боль- 
шей части не лингвисты, а логики, для которых есте- 
ственные языки являются не столько самостоятель- 
ным объектом описания, сколько иллюстративным 
материалом.) Поэтому мы вынуждены ограничиться 
простым упоминанием о нескольких работах подоб- 
ного рода, не претендуя ни в малейшей степени на 
полноту охвата хотя бы важнейших из них. 

Еще в 1940 году Б. Рассел обратил внимание на 
то, что в естественных языках предлоги и глаголы 
по своей семантической природе совпадают, а именно, 
и те и другие суть имена предикатов; например, 
предлог до и глагол предшествовать, при всем раз- 
личии их грамматических свойств, означают одно и 
то же — они выражают двухместный предикат 
«А предшествует В» (Виз5е] 1940, стр. 124)*). Из 
этого вытекает, в частности, очень важная мысль 
(впоследствии развитая в целом ряде работ), что тож- 
дество/различие смыслов слов естественного языка 
может быть определено путем сопоставления им точ- 
но определенных предикатов. 

Особое место среди работ по логическому анали- 
зу языка занимает раздел «Анализ разговорного язы- 
ка» книги Г. Рейхенбаха (Ве1сВепЬась 1960, стр. 
251—354). Здесь развивается идея классификации 
слов, исходящей из их логико-семантической приро- 
ды, а не из их формально-грамматических свойств, 
т. е. классификации, отличной от классификации 
по частям речи. Примерами логико-семантических 
классов являются класс одноместных предикатов 


*) Любопытно, что в ряде естественных языков, напри- 
мер во вьетнамском, предлог и глагол грамматически при- 
надлежат к одной категории: вьетн. $ — предлог ‘6? и глагол 
‘натодиться в’. 
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(глаголы вроде спать, прилагательные вроде умный, 
существительные вроде плакса), класс двухместных 
предикатов (любить, читать...; похожий, приятный... 
.. Жена, начальник...; поиск, исполнение...; над, 
позади...), класс предметных констант (нос, дерево, 
пушка), класс кванторных слов (все, один, везде, 
иногда, нечто), класс логических связок (и, или, а, 
но, если... то) и т. п. Логико-семантическая класси- 
фикация слов имеет глубокий лингвистический 
смысл; в частности, принадлежность слова к тому или 
иному классу существенно сказывается на его син- 
таксических свойствах. Кроме того, Рейхенбах рас- 
смотрел още целый ряд важных вопросов, из которых 
мы назовем только попытку анализа категории ар- 
тикля с помощью понятий -оператора (-— «тот, ко- 
торый...») и =-оператора (= «такой, который...»), 
а также набросок универсальной схемы глагольных 
времен. Данная работа Рейхенбаха стала класси- 
ческой, и большинство последующих работ по ло- 
гическому анализу языка в той или иной степени на 
нее опираются. 

Постановка задачи логического анализа языка и 
некоторые интересные примеры имеются в статье 
Оише 1961 (замечания о парных союзах как анало- 
гах скобок, о словах типа езегу — апу, о личных 
местоимениях — аналогах предметных переменных 
ит. д.). См. также Оише 1960. 

Следует отметить серию работ Элинор В. Чарни 
(например, СВагпеу 1961, 1962), в которых исследу- 
ется логическое строение значений английских со- 
юзов (типа #}, ии[ез5) и кванторных слов (а, езегу, 
апу...). Среди других вопросов здесь рассматрива- 
ется, в частности, вопрос о синонимии таких пред- 
ложений, как То тойе аЦ шотеп апа по теп 15 10 
таке а аиИ рати) и То теойе оу шотеп ап4 по теп 
15 10 таке а аи рагиу, означающих в точности одно 
и то же (Если пригласить только женщин и вовсе 
не пригласить мужчин, вечеринка будет скучной’), 
хотя различающие их слова а ‘все’ и ошу ‘только? 
отнюдь не являются синонимами. Результаты ука- 
занных работ подытожены в недавно вышедшей 
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книге (Срагпеу 1966), где излагаются также некото- 
рые общие соображения относительно изучения се- 
мантики логическими средствами. 

В работе К. Демана (ОбЪ тапи 1966) дается обзор 
способов, которыми выражаются все двухместные 
функции алгебры логики (конъюнкция: А & В, 
дизъюнкция: А\/В, строгая дизъюнкция: (А\/В) & 
| (А & В), импликация: А > Вит. д., всего 16) в 
самых разных естественных языках. Так, конъюнк- 
ция может быть выражена простым сополозжжением 
(кит. ма лю ‘лошадь и осел’, букв ‘лошадь осел’), 
простым со1озом (и, апа, её), парным союзом (как... 
так и), предлогом (Петя в Машей пришли...), пост- 
позитивной частицей (лат. депамз роршиздие го- 
тапиз ‘Сенат и римский народ’) и т. п. Обратный 
подход применен Е. В. Падучевой в статье Падуче- 
ва 1964в, где выясняется, что русским союзом или 
выражаются три разные логические функции: стро- 
гая дизъюнкция (7Гвоя книга лежит в шкафу или на 
столе *)), нестрогая дизъюнкция (в контексте яв- 
ной или «скрытой» импликации: Если у меня заболит 
горло или повысится температура, то я не поеду ка- 
тапься на лыжах; Студенты, выступавшие с докла- 
дом или подавшие письменный отчет, освобокдаются 
от экзамена) и конъюнкция (2? >> 0 при х > 0 или 
приз <0). 

В связи с проблемой перевода «язык логики 
предикатов — русский язык» Е. В. Падучева рас- 
смотрела также (Падучева 1964а и Падучева 1964г) 
вопрос о средствах выражения в русском языке ско- 
бок, ограничивающих области действия логических 
связок; оказалось, что русский язык позволяет обес- 
печить однозначность понимания с точки зрения рас- 
становки таких скобок: роль левых скобок играют 
части парных союзов, а без правых скобок можно 
обойтись [ср. (А &В)\/С=ишми А и В, или С; 
А &(В\/С) = как А, так и В или (]. 


*) Ср. Гвои книги лежат в шкафу или на столе, где из-за 
мн. числа слова книги союз или имеет значение нестрогой 
ДизЪъюЮнкции. 


«Логический анализ языка 161 


Пожалуй, наиболее систематический и обобщаю- 
щий обзор особенностей естественных языков с ло- 
гической точки зрения можно найти в статье У. Вейн- 
рейха (\У/’ештесВ 1963); однако изложение ее содер- 
жания завело бы нас слишком далеко. 

Теперь мы коснемся попыток другого типа! (на- 
помним, что речь идет о двух типах попыток фор- 
мального описания семантики, см. выше, стр. 157) — 
а именно, попыток, связанных с конструированием 
на базе языка логики предикатов более широких 
семантических языков. Поскольку описать даже 
простой язык достаточно кратко невозможно, нам 
придется отказаться от всяких содержательных 
разъяснений по существу перечисляемых здесь ра- 
бот; таким образом, то, что говорится ниже, следует 
рассматривать просто как библиографическую 
справку. 

Наиболее известны так называемые информацион- 
ные языки, создаваемые для конкретных областей 
науки и предназначаемые для записи сведений из 
этих областей в такой простой, явной и однозначной 
форме, которая была бы удобна для машинной обра- 
ботки (автоматический поиск нужной информации, 
автоматический вывод следствий из данных посы- 
лок, автоматическое реферирование и т. д.). В ка- 
честве примера можно сослаться на информацион- 
ный язык для элементарной геометрии, разрабаты- 
вавшийся в ВИНИТИ АН СССР (см. Кузнецов и 
др. 1961). 

Любопытным примером семантического языка 
(приобретшим благодаря его необычному назначе- 
нию широкую известность — не в том смысле, что 
многие знают его, а в том, что многие знают о 
нем) является построенный Г. Фройденталем «Лин- 
кос» (Шпема Созш1са), предназначаемый для об- 
щения с внеземными цивилизациями (Егеидепт а] 
1960). 

Наконец, имеется ряд семантических языков, 
разработанных для целей автоматического пере- 
вода, в процессе которого семантический язык дол- 
жен выступать в роли языка-посредника. Здесь мы 


6 А. Гладкий, И. Мельчук 
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упомянем семантические языки Кэмбриджсекого 
лингвистического кружка (Мастерман 1964 и Пар- 
кер-Роудс 1964), а также язык «СМ-1» для представ- 
ления математических текстов (Гладкий и др. 1961; 
в отличие от только что упомянутого информацион- 
ного языка для геометрии «СМ-1» должен служить 
для изображения не самого математического содер- 
жания, а фраз естественного языка, составляющих 
математический текст; поэтому он не годится, на- 
пример, для автоматического вывода следствий). 
Фактически семантический язык («предикатная за- 
пись с использованием семантических множителей») 
предложен в работе Жолковский — Леонтьева — 
Мартемьянов 1961; его развитие и существенное обо- 
гащение привели к новому языку, описанному в 
Жолковский — Мельчук 1967 («‹лексико-синтакси- 
ческие структуры и система перифразирования»). 
Заметим, что явного формального задания соответ- 
ствующих языков в двух последних работах не со- 
держится. 

В заключение этого раздела еще раз отметим (ср. 
стр. 156), что все изложенное в нем фактически не 
входит в математическую лингвистику, так что этот 
раздел по содержанию (да и по стилю, как читатель, 
вероятно, уже заметил) выпадает из рамок нашей 
книги. Тем не менее мы сочли целесообразным вклю- 
чить его в книгу, чтобы, так сказать, хотя бы «за- 
столбить» соответствующий участок, т. е., во-первых, 
подчеркнуть необходимость «семантического разде- 
ла» в математической лингвистике и, во-вторых, 
указать тот материал, на основе которого такой раз- 
дел, по-видимому, должен быть создан. 


Б. М одели рование 
лингвистических исследований 


До сих пор мы занимались исключительно фор- 
мализацией описания языка как такового, т. е. 
моделированием системы, определяющей речевую 
деятельность. В самом деле, рассмотренные выше 
формальные грамматики всех типов представляют 
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собой модели языка: их «поведение» (порождение или 
распознавание текстов) в некоторых существенных 
аспектах сходно с поведением людей, общающихся 
при помощи языка. Строя эти модели, мы широко 
пользовались нашими интуитивными представле- 
ниями об общих свойствах человеческого языка, 
практическим знанием конкретных языков (в наших 
примерах — русского), а также целым рядом при- 
нятых и вполне обычных в лингвистике (а по боль- 
шей части и в школьной грамматике) понятий и ка- 
тегорий таких, как «существительное», «глагол», 
«род», «падеж», «именная группа» и т. п. При этом 
мы не задавались вопросом, откуда у нас те или 
иные представления о языке, как именно мы осу- 
ществляем научное изучение языков, почему выб- 
раны такие категории (а не какие-нибудь другие) 
и что они собой представляют и т. д. Мы имели пол- 
ное право поступать так, поскольку нас интересо- 
вали только сами формальные грамматики безотно- 
сительно к тому, как мы к ним приходим. Однако 
этот вопрос вполне закономерен и, более того, 
чрезвычайно интересен. Чтобы ответить на него, 
надо создавать формальные модели тех процедур и 
тех средств, которыми мы фактически пользовались 
при построении грамматик, никак не уточняя их. 
Другими словами, надо создавать формальные мо- 
дели деятельности лингвиста (или вообще челове- 
ка, овладевающего языком). Результатом работы 
системы таких моделей в конце концов должны быть 
модели языка, т. е. формальная модель лингвисти- 
ческого исследования есть модель процесса построе- 
ния Моделей языка. О подобных моделях и пойдет 
речь ниже. 

Мы не будем давать здесь сколько-нибудь пол- 
ный обзор существующих или возможных моделей 
лингвистического исследования, а ограничимся 
краткой характеристикой двух конкретных моде- 
лей. Первая относится к аспекту анализа (форма- 
лизации) основных понятий и категорий лингвисти- 
ки, а вторая — к аспекту формализации самих про- 
цедур исследования. Разумеется, оба эти аспекта 


6* 
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тесно связаны: ведь’ процедура, ведущая к выделе- 
нию некоторого класса объектов, может рассматри- 
ваться как формальное определение этого класса — 
конструктивное ‚определение. Тем не менее их це- 
лесообразно разграничивать: во-первых, не всякое 
формальное определение задает конструктивную 
процедуру, а во-вторых, указанные аспекты разли- 
чаются точкой зрения, логическим акцентом — в слу- 
чае первого аспекта преимущественное внимание 
обращается на само анализируемое понятие, в слу- 
чае второго — на процедуру, ведущую к обнару- 
жению соответствующих объектов. 

В настоящее время имеется ряд работ, в которых 
делаются попытки формально определить различ- 
ные традиционные лингвистические понятия — . 
часть речи, падеж, род, фонему и т. п.*) (Зализняк 
1967, 1969, Ревзин 1967, Успенский 1964, Маркус 
1964, Магсаз 1963). Мы выберем для примера те из 
них, которые посвящены понятию составляющей. 
Ясно, что это понятие совершенно необходимо для 
описания языка. Так называемая структурная линг- 
вистика широко использует его в явном виде; тра- 
диционное же языковедение, хотя практически и не 
пользуется этим термином, по существу имеет дело 
с более или менее аналогичными понятиями: слово- 
сочетание, синтагма (в смысле В. В. Виноградова), 
синтаксическая группа, группа члена предложения 
и т. п., причем все эти понятия не определены с до- 
статочной четкостью и нередко понимаются по-раз- 
ному даже учеными, принадлежащими к одной шко- 
ле. Это делает построение формального аналога 
для понятия составляющей важной и интересной за- 
дачей (тем более в рамках настоящего изложения, 
где это понятие уже неоднократно использовалось — 
ср., например, стр. 61 и сл.). 

Для облегчения формальных рассмотрений еще 
раз приведем примеры составляющих. Во фразе 


*).Болыьшинство подобных работ советских и некоторых 
зарубежных исследователей восходит, в той или иной степе- 
ни, к пионерской работе О.С. Кулагиной (Кулагина 1958). 
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Снаружи вьюга мечется ш все заносит в лоск 
имеется 14 составляющих: 

1) вся фраза целиком; 

2) вьюга мечется и все заносит в лоск; 

3) мечется и все заносит в лоск; 

4) все заносит в лоск; 

5) все заносит; 


7—14) каждое слово, взятое само по себе. 

Два важных замечания: 

1. Разложение на составляющие не обязательно 
должно быть единственным даже в синтаксически 
однозначной фразе. Например, ...на черном дне 
твоих зеленых глаз может быть разложено на состав- 
ляющие разными способами: 


((на (черном дне)) (твоих (зеленых глаз))), или 
(на ((черном дне) (твоих (зеленых глаз)))), или 
(на (черном (дне (твоих (зеленых глаз))))), или 
((на (черном дне)) ((твоих зеленых) глаз )), 


причем это еще не все возможные разложения. (По- 
видимому, читателю будет полезно самостоятельно 
продолжить этот список.) 

2. Слова, способные образовывать составляю- 
щую, не обязательно образуют ее в любой фразе. 
Если иметь в виду «естественную» систему состав- 
ляющих, то, например, сочетание дело мастера яв- 
ляется составляющей во фразе Это, безусловно, дело 
мастера, и не является таковой во фразе Дело 
мастера боится; аналогично сочетание списки но- 
меров, которые хранятся в памяти является со- 
ставляющей во фразе Рассмотрим списки номеров, 
которые хранятся в памяти и не является состав- 
ляющей во фразе Лишим списки номеров, которые 
хранятся в памяти. 

Теперь мы можем перейти к формальному опре- 
делению составляющей. Точнее, будет определено 
понятие конфигурации, или потенциаль- 
ной составляющей. Содержательно, конфигурация— 
это такой отрезок текста (цепочка), который мо“ 
жет быть составляющей хотя бы в одной фразе 
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данного языка. Так, отрезки дело мастера или списки 
номеров, которые хранятся в памяти суть конфигу- 
рации, хотя они и не всегда составляющие (см. 
выше) *). 

Определим сначала понятия замещаемости и 
взаимозамещаемости. Пусть имеется некоторый язык 
[, со словарем ТУ (т. е. некоторое множество цепочек 
из входящих в И символов). Рассмотрим две цепоч- 
ки хи у, состоящие из символов словаря Г (№В:х 
и у не обязательно принадлежат Г). Цепочка х за- 
мещаема на у в языке Г, [обозначение: х => у (Г)], 
если для любых двух цепочек риф из раа Е Г, сле- 
дует руа 6 Г, (р и 4 не обязательно принадлежат Г; 
в частном случае они могут быть пустыми). Содер- 
жательно это означает, что в любой правильной фра- 
зе цепочку 1 можно заменить на у, не нарушая пра- 
вильности; обратное, вообще говоря, неверно. На- 
пример, словоформа чай замещаема словоформой 
кофе, но не наоборот (пачка кофе, но не* пачка чай); 
напевы замещаемо на забытые напевы, но не наобо- 
рот (давно забытые напевы, но не *давно напевы). 

Цепочка 5х взаимозамещаема су в языке Г, [обоз- 
начение: х<>у ([)], если х>у (Е) уз = (Г). 
Примеры: песком и гравием, исключительно важных 
и важных и т. п. 

Понятие конфигурации определяется индуктив- 
но: сначала мы определим конфигурацию 1-го ран- 
га (базис индукции), а затем через нее — конфигу- 
рации высших рангов (индукционный шаг). 

а) Базис индукции. Конфигурация 1-го 
ранга языка С — это цепочка, состоящая не менее 
чем из двух символов и взаимозамещаемая с одним 
символом, который называется результирующей 
данной конфигурации. 

АВ: 1. Результирующая не обязательно долж- 
на быть одним из символов, входящих в конфигура- 
цию. 


*) Обращаем внимание на то, что в некоторых советских 
работах по автоматическому переводу термин «конфигура- 
ция» используется совсем в другом смысле. 
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2. Конфигурация не обязательно имеет только 
одну результирующую. 

Примеры: исключительно важный <> важный, 
ценный, полезный ...; не очень < слишком. 

Обратим внимание на то, что выявление конфи- 
гураций в русском языке (а вероятно, и в других 
естественных языках) обязательно предполагает 
значительное огрубление наших представлений об 
этом языке, точнее, о грамматической правильности 
его фраз. А именно, признание указанных в примерах 
взаимозамещаемостей предполагает признание грам- 
матической правильности, с одной стороны, цепочек 
типа исключительно исключительно исключительно... 
важный (поскольку в исключительно важный слово 
важный можно заменить на исключительно важный 
и т. д. сколько угодно раз), а с другой стороны, це- 
почек типа очень. исключительно важный (из очень 
важный). Ср. также это уже не очень из это уже 
слишком, не не очень влюбчив из не слишком влюбчив 
и т. п.; аналогично печальные забытые напевы из 
печальные напевы, тотда как правильнее было бы 
забытые печальные напевы (см. выше, стр. 83—84). 
Подобная ситуация уже возникала раньше: строя 
примеры формальных грамматик, мы также были вы- 
нуждены признавать допустимость сколь угодно 
длинных цепочек типа сладкая сладкая сладкая. . 
нежность (стр. 57) или таких цепочек, как сладкая 
горькая нежность, сладкая соль и т. п. 

6) Индукционный шаг. — Допустим, 
что мы уже определили конфигурации всех рангов 
до ранга и включительно. Определим тогда конфигу- 
рацию ранга п {+ 1. Это цепочка 5, состоящая не 
менее чем из двух символов и удовлетворяющая 
следующим двум условиям: 

1°. В словаре языка Г имеется символ а, заме- 
щаемый на т. 

2°. Цепочка х также замещаема на а, но не аб- 
солютно, а с некоторыми ограничениями. Именно, 
в цепочке рха (рае; р и а-— произвольные це- 
почки) х можно заменить на а (т. е. раде Г), если в 
цепочке рха нет конфигураций ранга п или ниже, 


7-3 
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которые пересекались бы с х, не содержась при 
этом в нем целиком. (Смысл этого условия состоит 
в том, что для возможности замены цепочки х на 
а цепочка х не должна иметь слева или справа от 
себя поясняющих слов, которые оставались бы 
«без хозяина» в случае замены х на а, см. примеры 
ниже.) 

Символ а называется результирующей конфигу- 
рации 1*). 

Приведенное определение содержательно озна- 
чает следующее. Во-первых, любую конфигурацию 
можно получить путем развертывания некоторого 
символа, а именно — ее результирующей. Во-вто- 
рых, любую конфигурацию можно «свернуть» к ее 
результирующей; однако конфигурацию ранга п 
можно «свертывать» только после того, как во фразе 
«свернуты» все конфигурации меньших рангов (от 
1 доп —1), имеющие с ней общую часть. Напри- 
мер, конфигурацию 2-го ранга важный фактор во 
фразе ...учитывает этот исключительно важный 
фактор нельзя «свернуть», пока не свернута пере- 
секающаяся с ней конфигурация 1-го ранга искию- 
чительно важный, так как иначе получилось бы 
неправильное ...*учитывает этот исключительно 
фактор. Далее, конфигурацию 3-го ранга воду пить 
(с результирующей пить) во фразе Грязную воду 
пить не следует нельзя «свернуть», пока не «свер- 
нута» конфигурация 2-го ранга грязную воду (эллип- 
тическую фразу Грязную пить не следует, которая 
получилась бы в противном случае, мы не считаем 
правильной). 

Важно подчеркнуть, что данное определение кон- 
фигурации не является конструктивным — в нем не 
содержится никаких указаний на способ обнаружи- 
вать конфигурации в цепочках данного языка. 


_ *) Следует иметь в виду, что в работах по математической 
лингвистике встречаются и другие варианты определения по- 
нятия конфигурации, не эквивалентные только что сформули- 
рованному (Кулагина 1958, Моуофту 1965). Однако здесь 
имеются в виду именно варианты одного и того же понятия, 
а не совсем другое понятие, упомянутое в сноске к стр. 166. 


Та 
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Более того, неконструктивно и определение заме- 
щаемости: в самом деле, если бы мы захотели, поль- 
зуясь непосредственно определением, узнать, заме- 
щаема ли конкретная цепочка 1 на какую-то другую 
цепочку у (в языке Г), нам пришлось бы перебрать 
все цепочки языка С, содержащие х, а таких цено- 
чек в общем случае бесконечно много. 

Оказывается, что можно утверждать и больше: 
существуют КС-языки, для которых нет алгоритма 
распознавания конфигураций, т. е. алгоритма, спо- 
собного для любой данной цепочки решить, являет- 
ся ли она конфигурацией (ср. выше, стр. 116). 

С понятием конфигурации естественно связы- 
вается ряд других понятий — таких, как простая 
конфигурация (конфигурация, не содержа- 
щая в себе других конфигураций того же ранга, а 
тем самым — и конфигураций меньших рангов *); 
аналог минимальной неэлементарной составляющей) 
и неприводимая цепочка (цепочка, 
принадлежащая языку, т. е. являющаяся грамма- 
тически правильным предложением, и не содержа- 
щая в себе конфигураций, т. е. не допускающая 
свертываний. Неприводимыми цепочками являются, 
например, в русском языке безличные предложения 
типа Морозит или Смеркалось, а в английском и 
французском языках — любые предикативные па- 
ры типа Не геа4$ или [1 р[еиф). На основе этих по- 
нятий строится определение конфигурацион- 
ной характеристики языка. Конфигура- 
ционная характеристика есть совокупность двух пе- 
речней: это 1) перечень простых конфигураций, где 
для каждой конфигурации указана ее результирую- 
щая (или результирующие), и 2) перечень неприво- 
димых цепочек. Вообще говоря, оба эти перечня 
могут быть бесконечными. 

Любопытно, что конфигурационная характери- 
стика полностью определяет язык в том смысле, что 
не может быть двух разных языков с одной и той 


*) Конфигурация ранга п есть в то же время и конфигура- 
ция] любого ранга, большего п; это непосредственно следует 
из определения конфигурации. 


° 
= 
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же конфигурационной характеристикой. Дело в том, 
что конфигурационная характеристика по сущест- 
ву есть не что иное, как набор элементарных цепо- 
чек и правил их комбинирования в цепочки языка. 
Ясно, что если наборы элементарных цепочек и 
правила их комбинирования одинаковы, то и полу- 
ченные языки должны быть одинаковыми. 

В случае, если перечни простых конфигураций 
и неприводимых цепочек конечны, соответствую- 
щий язык называется конечно-характе- 
ризуемым. (Интуитивно очевидно, что есте- 
ственные языки являются  конечно-характери- 
зуемыми.) Выше (стр. 94) уже отмечалось, что 
все конечно-характеризуемые языки являются 
КС-языками. 

Мы не будем излагать здесь теорию конфигура- 
ций более подробно, так как нашей единственной 
целью было привести пример формального понятия 
(в нашем случае — конфигурации), выработанного 
математической лингвистикой в качестве уточняю- 
щей модели для одного из достаточно расплыв- 
чатых общелингвистических понятий (в нашем 
случае — для составляющей, точнее, для «типа со- 
ставляющей», а не для конкретной составляющей в 
конкретной фразе). 

Что касается формализации процедур лингви- 
стического исследования, то эта область изобилует 
работами самых разнообразных направлений. Фор- 
мализация процедур исследования находилась в 
центре внимания целой лингвистической школы — 
американской дескриптивной лингвистики — бо- 
лее тридцати лет (см., например, Нагг1з 1963). Кро- 
ме того, сюда относятся работы по дешифровке 
текстов, написанных на неизвестных языках или 
неизвестной письменностью. (Деятельность дескрип- 
тивистов или специалистов-дешифровщиков по боль- 
шей части не относится непосредственно к матема- 
тической лингвистике, однако подготавливает поч- 
ву для развития того ее раздела, о котором сейчас 
идет речь.) В настоящее время активно разрабаты- 
вается теория так называемой автоматической клас- 
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сификации, где ставится следующая задача: дано 
множество элементов текста, которым приписаны 
некоторые свойства; требуется автоматически раз- 
бить это множество на такие классы, чтобы элемен- 
ты одного класса были с точки зрения указанных 
свойств более похожи друг на друга, чем элементы 
разных классов; подобные классы называют «сгу- 
стками» (сТатрз). Имеются также и работы других 
типов. 

Мы рассмотрим здесь для примера предложенный 
в работе Сухотин 1962 алгоритм, который «умеет» 
в произвольном тексте на неизвестном (для алгорит- 
ма) языке обнаруживать гласные и согласные бук- 
вы (если, разумеется, текст написан буквенным 
письмом). При этом не используются никакие све- 
дения о том конкретном языке, на котором написан 
текст. Единственная привлекаемая информация со- 
стоит в предположении, что общим свойством есте- 
ственных языков является сравнительно равномер- 
ное распределение гласных и согласных в речи. 
Другими словами, это означает, что каков бы ни 
был язык, в тексте на нем чаще встречаются рядом 
(оказываются непосредственными соседями) глас- 
ная с согласной, а не гласная с гласной или соглас- 
ная с согласной. (Например, в предыдущей фра- 
зе — за вычетом словосочетания в скобках — 
имеется 94 сочетания гласных © согласными, 31 со- 
четание согласных с согласными и 7 сочетаний глас- 
ных с гласными. Подсчет производится так, как 
если бы фраза была напечатана без пробелов; буквы 
е, ю и я считались гласными, а й — согласной.) 
Сформулированное допущение и лежит в основе ал- 
горитма выявления гласных и согласных. Этот ал- 
горитм разбивает все встречающиеся в тексте буквы 
на два класса Ги С таким образом, чтобы суммарная 
частота сочетаний типа ГС и СГ была больше, чем 
суммарная частота сочетаний ГГ и СС. Подобных 
разбиений может быть много, и среди них надо 
уметь выбрать наилучшее. Наилучшим же разбие- 
нием естественно считать такое, при котором раз- 
ность суммарных частот сочетаний ГС и СГ, с одной 
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стороны, и ГГ и СС, с другой стороны, будет наи- 
большей, т. е. при котором классы Г и С будут мак- 
симально полярны. 

Теперь мы сформулируем то же самое более точ- 
но. Пусть в тексте встречается п разных букв: а1, 


а.,..., ал. Допустим, что все эти буквы уже каким- 
нибудь способом разбиты на два класса — Х и У. 
Для каждой пары букв а; а; (1, } =1, 2,..., п) 


подсчитаем число появлений этой пары в тексте 
(порядок а; и а; безразличен, т. е. а, а; отождеств- 
ляется с а: а;). Это число мы обозначим Р (а, а;}; 
например, во ‘фразе, для которой выше производи- 
лись подсчеты («Другими словами,...»), Е (гл) = 
— 6, Г (08) =2, ЕЁ (ру) =1, Е (щл) = 0. Образуем 
сумму >», всех чисел Р (а, а) для таких пар а, а,, 
где а; и а; принадлежат к разным классам (а, 6 Х, 
а; © У или а, ЕТ, а;ЕХ). Далее образуем ана- 
логичную сумму Х, всех чисел Р (а, а;) для таких 
пар а, а;, где а, и а; принадлежат одному классу 
(а;, а; ЕХ или а, а; в У). Разность №, — №, назы- 
вается функцией выгодности и обозна- 
чается Р\(Х, У). Наилучшим разбиением множе- 
ства букв на классы Х и У будет то, при котором 
Р (Х, У) принимает максимальное значение. Это 
и есть определение наилучшего разбиения. 

Поскольку множество букв конечно, существует 
тривиальный алгоритм нахождения максимума 
функции Р (Х, У) — полный перебор: надо произ- 
вести все возможные разбиения множества букв 
на классы Х и У, для каждого разбиения вычислить 
Р (ХУ, У) и среди полученных значений Р (их конеч- 
ное число!) выбрать наибольшее. Соответствующее 
‘разбиение и будет искомым *). 


*) В общем случае функция Р (Х, У) может принимать 
одно и то же максимальное значение для нескольких разных 
разбиений. 

Содержательно это означает наличие нескольких равно- 
правных классификаций букв. Подобная ситуация, действи- 
тельно, встречается в реальных языках: имеются буквы (на 
самом деле — звуки), которые по их сочетательным свойст- 
вам можно считать как гласными, так и согласными (так назы- 
ваемые полугласные, в некоторых языках—сонорные и т. п.). 
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Однако подобный алгоритм практически неосу- 
ществим: при алфавите, например, из 30 букв приш- 
лось бы перебирать 23° (т. е. больше миллиарда) 
различных разбиений. Поэтому были предложены 
(в работах Сухотин 1962, 1963) другие, более эко- 
номные алгоритмы, которые легко реализуются на 
электронной вычислительной машине. Эти алгорит- 
мы были запрограммированы и опробованы в ряде 
экспериментов для русского, английского, немец- 
кого, французского и испанского языков. Резуль- 
таты экспериментов оказались вполне удовлетвори- 
тельными; немногочисленные допущенные ошибки 
объяснятотся в основном условностями орфографии, 
например, тем, что один звук обозначается сочета- 


нием букв (ср. нем. сй = [{] ит. п.). Сами алгорит- 
мы здесь не описываются, поскольку их конкретное 
устройство менее существенно для наших целей, 
чем постаповка и принципы решения задачи. 

У читателя может возникнуть вопрос: как соот- 
носится сделанное выше (стр. 20—22) утверждение 
о неколичественном характере математической линг- 
вистики и включение в нее работ (типа только что 
рассмотренной), где существенно используются ко- 
личественные данные (в нашем случае — частоты). 
На самом деле, здесь нет противоречия. Во всех 
этих работах конечной целью является получение 
чисто качественных результатов — 
классификаций и т. п., а не количественных харак- 
теристик или закономерностей. Вычисления здесь 
представляют собой промежуточный этап, т. е. при 
всей своей важности остаются вспомогательным 
средством. 

Использование разнообразных функций выгод- 
ности кладется в основу также и других алгоритмов 
выделения и классификации языковых единиц. Нап- 
ример, в статье Сухотин 1963 изложен алгоритм 
членения написанного без пробелов текста на мор- 
фы. Функция выгодности строится здесь исходя из 
того соображения, что суммарная частота совмест- 
ной встречаемости букв, входящих в одну мор- 
фу, больше, чем суммарная частота совместной 
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встречаемости букв из разных морф. Ср. также алго- 
ритм обнаружения синтаксически связанных слов 
в тексте на неизвестном языке (Сухотин 1963). 

Здесь наше изложение подходит к концу. Нам 
остается попрощаться с читателем, взявшим на себя 
труд дойти вместе с нами до этих строк. Впрочем, 
если его терпение еще не истощилось, он может об- 
ратиться к Заключению и к Приложениям Ги П: 
в первом из них дана сводка важнейших математи- 
ческих результатов теории грамматик, а второе 
представляет собой комментированный словарик 
терминов математической лингвистики. Благодарим 
за внимание! 


Заключение 


В самом начале книги, на стр. 16, было сказано: 
Математическая лингвистика есть математическая 
дисциплина, «обращенная» в сторону естественных 
языков и лингвистики. Теперь, когда наше изложе- 
ние закончено, мы можем и даже, по-видимому, 
должны уточнить эту недостаточно конкретную фор- 
мулировку, для чего мы рассмотрим вопрос о соот- 
ношении между математической лингвистикой и 
«просто» лингвистикой, с одной стороны, и между 
математической лингвистикой и математикой — с 
другой. 

Лингвистика, или, точнее, теоретическая лингви- 
стика (в противоположность описательной), может 
быть охарактеризована как наука, занимающаяся 
построением формальных моделей естественных язы- 
ков и методологией построения таких моделей. Она 
строит модели, поскольку теоретическое изуче- 
ние любого объекта (в данном случае — языка) 
не может быть ничем иным, как созданием его моде- 
лей, а эти модели должны быть формальны- 
ми — при изучении естественных языков рассмат- 
ривать какие-либо иные «модели» нецелесообразно. 
В то же время читатель, видимо, заметил, что и ма- 
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тематическая лингвистика занимается разработкой 
формальных конструкций, призванных служить 
моделями естественных языков. Однако здесь имеет- 
ся весьма существенное различие, заключающееся 
в следующем. Лингвистика разрабатывает теорию 
языка как такового, т. е. общую модель языка, а так- 
же строит конкретные модели конкретных языков 
или их фрагментов; математическая лингвистика 
изучает на абстрактном уровне самые общие свой- 
ства таких моделей, исследуя средства и методы их 
построения. Другими словами, математическая линг- 
вистика создает и исследует абстрактные (можно бы- 
ло бы сказать «умозрительные» или, пользуясь уста- 
ревшим термином, «спекулятивные») модели конкрет- 
ных лингвистических моделей, т. е. «модели второго 
уровня». Математическая лингвистика занимается, 
так сказать, материалами, инструментами, общей тео- 
рией строительства; лингвистика же непосредственно 
возводит здания. Если лингвистика есть теория кон- 
кретных языков и языка вообще, то математическая 
лингвистика — это теория строения этой теории, т. е. 
метатеория, или металингвистика. Строя модели ес- 
тественных языков, лингвистика неминуемо поль- 
зуется некоторым определенным языком (который 
является метаязыком по отношению к описываемым 
естественным языкам). Разработкой и чисто фор- 
мальным исследованием этого языка лингвистики и 
занимается математическая лингвистика. 
Разумеется, абсолютно четкую границу между 
лингвистикой и математической лингвистикой про- 
вести невозможно. Лингвист, разрабатывающий 
конкретную модель языка, может заняться изуче- 
нием в общем виде тех средств, которыми он поль- 
зуется; специалист по математической лингвистике, 
исследуя свои чисто абстрактные конструкции, также 
может заинтересоваться их возможной интерпрета- 
цией, т. е. их приложением к конкретным языкам. 
В результате во многих реальных работах сферы лин- 
гвистики и математической лингвистики настолько 
тесно переплетаются, что отнести работу к одной 
из этих областей затруднительно. Тем не менее 
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сформулированное выше противопоставление в прин- 
ципе сохраняет силу: лингвистика сосредоточена 
в первую очередь на описании общих законов и 
свойств языка, а также отдельных конкретных язы- 
ков, математическая лингвистика — на изучении 
средств и способов этого описания. 

Что же касается взаимоотношений между мате- 
матической лингвистикой и математикой, то, как 
должно быть видно из предшествующего изложения, 
первая есть часть второй. При этом из всех мате- 
матических дисциплин математическая лингвистика 
стоит ближе всего к математической логике и значи- 
тельной своей частью (здесь имеется в виду теория 
грамматик) просто входит в нее. А поскольку мате- 
матическая логика занимается изучением языка ма- 
тематики, то и математическая лингвистика приме- 
нима и применяется для этой цели. В частности, лю- 
бопытно отметить, что категориальные грамматики 
были введены К. Айдукевичем еще в 1935 г. для 
исследования строения некоторых математических 
систем. В последнее время формальные грамматики 
широко используются для задания (описания) так 
называемых языков программирования (искусствен- 
ных языков, применяемых для записи алгоритмов с 
целью придать им стандартную форму, которая об- 
легчала бы их ввод в вычислительную машину). 
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Сводка математических результатов 


Ниже формулируется ряд наиболее существен- 
ных, по мнению авторов, утверждений, относящихся 
к различным разделам математической лингвисти- 
ки. Большинство из них (но не все) содержится в 
тексте книги (ср. замечание на стр. 13). Для боль- 
шей обозримости здесь повторяются также некото- 
рые определения. После каждой теоремы указаны 
соответствующие страницы книги, а также работы, 
содержащие доказательство теоремы. 


1. Порождалощие грамматики 


Основные определения. Порождаю- 
щая грамматика (ПГ) есть упорядоченная четвер- 
ка <Я, 7,, Т, В», где 7 и ТР, — непересекающиеся 
конечные множества символов (7 — основной сло- 
варь, И, — вспомогательный словарь), ТГ — эле- 
мент У, (начальный символ), а & — конечное 
множество правил вида А -> В, где Аи В — произ- 
вольные цепочки над словарем Я |] 7, (схема грамма- 
тики). Определения непосредственной выводимости, 
выводимости и вывода см. стр. 43; определение 
языка, порождаемого грамматикой, см. стр. 46. 

1.1. Соотношение между различ 
ными классами порождающих грамма- 
ТИК. 

Неукорачивающая грамматика — ПГ, в каждом 
правиле которой правая часть не. короче левой: 


1 (4) ЕВ). 
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Грамматика непосредственно составляющих (НС- 
грамматика) — ПГ, каждое правило которой имеет 
вид 7,С2. — .И’Ё., где С — вспомогательный сим- 
вол, а Й’ — непустая цепочка. 

Контекстно-свободная грамматика (КС-грамма- 
тика) — ПГ, каждое правило которой имеег вид 
С —Т,, где С — вспомогательный символ, а И’ — 
непустая цепочка. 

Бинарная —КС- -грамматика — КС-грамматика, 
в каждом правиле которой правая часть содержит не 
более двух символов. 

Автоматная грамматика (А-грамматика) — КС- 
грамматика, в каждом правиле которой правая 
часть либо состоит из одного символа, либо имеет 
вид БВ, где 6 — основной символ, а В — вспомога- 
тельный символ. 

КС-грамматика с ограниченной памятью — ЁЕС- 
грамматика, для которой существует такое число К, 
что какова бы ни была терминальная цепочка т, 
выводимая в этой грамматике, найдется такой вы- 
вод этой цепочки из начального символа в данной 
грамматике, что любая промежуточная цепочка 
этого вывода содержит вспомогательные символы не 
более чем на К последних местах. 

КС-грамматика с независимым двусторонним 
развертыванием — см. определение на стр. 102—103. 

Теорема 1.1.1. Класс языков, порождаемых 
грамматиками, совпадает с классом рекурсивно пе- 
речислимых языков (стр. 49; Паяез 1958 и Гладкий 
1966). 

Теорема 1.1.2. Класс языков, порождае- 
мых неукорачивающими грамматиками, совпадает с 
классом НС-языков; более того, для всякой 
неукорачивающей грамматики можно эффективно 
построить эквивалентную ей НС-грамматику 
(стр. 54; Хомский 1966, стр. 165, и Гладкий 1966, 
стр. 72). 

Теорема 1.1.3. Существуют НС-языки, не 
являющиеся ИС-языками, например, {а“б”а”} 
(стр. 65; Ваг-НШе! — Рег]ез — ЗВашаг 1961 и Глад- 
кий 1966, стр. 91). 
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Теорема 1.1.4. Для всякой КС-граммати- 
ки можно эффективно построить эквивалентную ей 
бинарную КС-грамматику (стр. 67; Гладкий 1966, 
стр. 83). 

Теорема 1.1.5. Существуют КС-языки, не 
являющиеся А-языками, например, {а” 6"} (стр. 
71; Гладкий 1966, стр. 102). 

Теорема 1.1.6. Для всякой КС-граммати- 
ки с ограниченной памятью можно эффективно по- 
строить эквивалентную ей А-грамматику (стр. 100). 

Теорема 1.1.7. Для всякой КС-граммати- 
ки с независимым двусторонним развертыванием 
можно эффективно построить эквивалентную ей 
А-грамматику (стр. 104). 

Теорема 1.1.8. а) Класс НС-языков замкнут 
относительно операций теоретико-множественного 
объединения и пересечения *). 6) Класс ИС-языков 
замкнут относительно операции теоретико-множест- 
венного объединения и не замкнут относительно 
операций теоретико-множественного пересечения и 
дополнения. в) Класс А-языков замкнут относитель- 
но операций теоретико-множественного объедине- 
ния, пересечения и дополнения (см. Гладкий 1966, 
стр. 104, и Хомский 1966). 

1.2. Алгоритмические проблемы 
теории порождающих грамматик. 

Теорема 1.2.4. В классе всех грамматик ни 
одно нетривиальное свойство языков, порождаемых 
грамматиками, не распознаваемо (см. стр. 1153; 
Гладкий 1966, стр. 161) **). 

Теорема 1.2.2. В классе НС-грамматик свой- 
ство порождать язык, содержащий данную цепоч- 
ку, распознаваемо (стр. 114). 


*) Вопрос о замкнутости класса НС-языков относительно 
операции дополнения остается открытым; иместся в виду до- 
полнение до множества всех непустых цепочек над данным 
терминальным словарем. 

**) Эта теорема есть простое следствие теоремы Райса, до- 
казательство которой имеется, например, в книге А. И. Маль- 
цева «Алгоритмы и рекурсивные функции», М., 1965, 
стр. 147. 


180 Приложение 1 


Теорема 1.2.3. В классе НС-грамматик сле- 
дующие свойства нераспознаваемы: порождать дан- 
ный (произвольный) НС-язык, порождать конечный 
язык, порождать ВС-язык, порождать язык с заме- 
щаемостью 5 на у, где хи у — произвольные (фикси- 
рованные) цепочки (стр. 114; Гладкий 1966, стр. 
163—171; Гладкий 19646). 

Теорема 1.2.4. В классе ЕКС-грамматик сле- 
дующие свойства распознаваемы: порождать пустой 
язык, порождать конечный язык, порождать хотя 
бы одну цепочку, содержащую вхождение данной це- 
почки х (стр. 1145; Ваг-НШе — Ре]ез — ЗВапит 
1961; Гладкий 1966, стр. 85—89). 

Теорема 1.2.5. В классе КС-грамматик сле- 
дующие свойства нераспознаваемы: порождать 
А-язык, порождать полный язык (язык, содержащий 
все терминальные цепочки над данным словарем), 
иметь эквивалентную КС-грамматику, приписываю- 
щую каждой терминальной цепочке только одну 
синтаксическую структуру (стр. 115; Ваг-НШе — 
Рег1ез — ЭЪапих 1961; Гладкий 1966, стр. 171—181). 

Теорема 1.2.6. В классе А-грамматик сле- 
дующие свойства распознаваемы;: порождать полный 
язык, порождать язык с конечным дополнением 
(стр. 115 Ваг-НШе — Ре]ез — БВапиыг 1961). 

Теорема 1.2.7. Не существует алгоритма, 
позволяющего по любой паре КС-грамматик узнать, 
являются ли они эквивалентными (стр. 115; Ваг- 
НШе! — Регез — Эвапиг 1961, Гладкий 1966). 

Теорема 1.2.8. Существует алгоритм, позво- 
ляющий по любой паре А-грамматик узнать, являют- 
ся ли они эквивалентными (стр. 115; Ваг-НШе — 
Регез — Эвапит 1960, Гладкий 1964а). 

Теорема 1.2.9. Существует КС-грамматика 
Г, для которой невозможен алгоритм, позволяющий 
по любой паре цепочек х, у узнать, замещаемо *) ли 
1 на у в языке Г, (Г) (стр. 116; Гладкий 1965). 

Теорема 1.2.410. Для всякой А-грамматики Г 
существует алгоритм, позволяющий по любой паре 


*) Определения замещаемости и конфигурации см. стр. 
166—168. 
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цепочек х, у узнать, замещаемо ли х на у в языке 
Г. (Г) (стр. 116; Гладкий 1964а). 

Теорема 1.2.11. Существует КС-грамматика Г, 
для которой невозможен алгоритм, позволяющий 
по любой цепочке узнать, является ли она конфигу- 
рацией *) языка С (Г) (стр. 169; Лучкин 1966). 

Теорема 1.2.12. Для всякой А-грамматики Г 
существует алгоритм, позволяющий по произволь- 
ной цепочке х, символу а и числу п узнать, яв- 
ляется ли т конфигурацией ранга п языка Г (Г) 
с результирующей а (Гладкий 1964з). 

Теорема 1.2.13. Для всякой неукорачиваю- 
щей грамматики существует алгоритм, позволяющий 
по любой цепочке узнать, выводима ли она в данной 
грамматике из ее начального символа (стр. 50). 

1.3. Оценки сложности вывода. 

Теорема 1.3.1. Для всякой неукорачиваю- 
щей грамматики Г имеет место неравенство тг (1) < 
< р"", где тг — временная  сигнализирующая 
функция грамматики Г (см. стр. 1446), а р — общее 
число основных и вспомогательных символов этой 
грамматики (стр. 417). 

Теорема 1.3.2. Для всякой КС-грамматики 
Г имеет место неравенство тг (п) < 2 Сп, где С — 
число вспомогательных символов грамматики Г 
(стр. 117). 

Теорема 1.3.3. Язык {142} (см. стр. 91) 
не может быть порожден никакой НС-грамматикой, 
у которой временная сигнализирующая функция 
тг (п) по порядку меньше чем п? (стр. 118; Гладкий 

4в.). 

Теорема 1.3.4. Класс языков, порождаемых 
грамматиками с ограниченным растяжением, совпа- 
Дает с классом НС-языков; более того, для всякой 
грамматики с ограниченным растяжением можно 
эффективно построить эквивалентную ей НС-грамма- 
тику (стр. 105; Гладкий 1964 в). 


*) В статье Гладкий 19636 вместо термина «грамматики 
с ограниченным растяжением» используется термин «грамма- 
тики с линейной памятью». 
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2. Лругие типы формальных грамматив 


Определение категориальной грамматики 
(К-грамматики) см. стр. 125; определение автомата с 
магазинной памятью (М-автомата) см. стр. 148—149. 

Теорема 2.1. Всякий К-язык есть ИС-язык; 
более того, для всякой К-грамматики можно эффек- 
тивно построить эквивалентную ей КС-грамматику 
(см. стр. 133; Ваг-НШе|! — СаЙйтап — ЭВапиг 1960; 
Гладкий 1966, стр. 123). 

Теорема 2.2. (Гайфман). Всякий КС-язык 
есть В-язык; более того, для всякой КС-грамматики 
можно эффективно построить эквивалентную ей 
К-грамматику (см. стр. 133; Ваг-НШе| — СаИшап — 
ЭБаплиг 1960; Гладкий 1966, стр. 123). 

Теорема 2.3. (Хомский). Всякий М-язык есть 
КС-язык; более того, для всякого М-автомата мож- 
но эффективно построить эквивалентную ему КС- 
грамматику (стр. 149; Хомский 1966). 

Теорема 2.4. Всякий ВКС-язык есть М-язык; 
более того, для всякой КС-грамматики можно эд- 
фективно построить эквивалентный ей М-автомат 
(стр. 149; Хомский 1966). 


3. Вонфигурации 


Цепочка х замещаема на цепочку у в языке Ё 
[обозначение: х — у (Г)], если для любых двух це- 
почек ри 4 из рад Е Г, следует руд 6 С. Цепочка х 
взаимозамещаема с цепочкой у в языке ГД, если 
х —> и ([) и у=> х (Г) [обозначение: ху (Г)]. 

Если х — цепочка, состоящая не менее чем из 
двух символов и а — символ, то х называется кон- 
фигурацией 1-го ранга (языка Г.) с результирующей а, 
если х<>а (Г). Если определены конфигурации 
рангов < и и если х — цепочка, состоящая не ме- 
нее чем из двух символов, и а— символ, то х назы- 
вается конфигурацией ранга п -- 1 (языка С) с ре- 
зультирующей а, если: 1) а > х (Г) и 2) для любых 
двух цепочек р ид из того, что рха принадлежит Ё 
и не содержит вхождений конфигураций рангов <п, 
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пересекающихся с выделенным вхождением х, но не 
содержащихся в нем целиком, следует, что рад 
принадлежит С (см. стр. 166). 

Простая конфигурация (языка Г) — конфигу- 
рация, не содержащая вхождений других конфигу- 
раций того же ранга; неприводимая цепочка языка 
Г, — цепочка, принадлежащая языку Г, и не содержа- 
щая вхождений конфигураций языка Д. 

Конфигурационная характеристика языка КЁ 
есть упорядоченная пара ‹<Б (Г), П (Г), где 

(Г) — множество всех неприводимых цепочек язы- 
ка Си П (Г) — множество всевозможных упорядо- 
ченных пар вида <а, х», где х — простая конфигура- 
ция языка Д и а — ее результирующая. 

Если Б (Г) и П (ГР) конечны, то Г, называется ко- 
нечно характеризуемым языком. 

Теорема 3.1. Если [4 и Г. — языки над од- 
ним и тем же словарем и Б (71) = Б (Г.5), П (Ё1) = 
—= П (15), то 1[1=Г.; иначе говоря, язык над дан- 
ным словарем полностью определяется своей конфи- 
гурационной характеристикой (стр. 470; Гладкий 
1963а). 

Теорема 3.2. Класс конечно характеризуе- 
мых языков содержится в классе АС-языков; более 
того, по конечной конфигурационной характеристи- 
ке языка можно эффективно построить ВС-грамма- 
тику, порождающую этот язык (стр. 470; Гладкий 
1963а). 

Теорема 3.3. Существуют ИС-языки (и даже 
А-языки), не являющиеся конечно характеризуе- 
мыми (Гладкий 1963а). 

Теорема 3.4. Всякий А-язык без омонимии*) 
является конечно. характеризуемым языком; обрат- 
ное неверно (Гладкий 1963а). 

Теорема 3.5. Существуют КС-языки, в ко- 
торых для любого натурального числа п имеются 
конфигурации ранга п, не являющиеся конфигура- 
циями ранга и — 1 (Лучкин 1966). 


*) Язык, порождаемый такой А-грамматикой, что никакие 
два ее правила, имеющие разные левые части, не могут со- 
держать в правых частях один и тот 2ке основной символ. 
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Приложение П 


Краткий словарь основных терминов 
математической лингвистики 


Автомат с магазинной памятью (М-автомат) — 
раз№-о\уп эоте ащюотаюл/тасше. См. стр. 136. 

Автоматная грамматика (А-грамматика) — Нице 
5бабе сташтаг. Калькирующий русский термин «грам- 
матика с конечным числом состояний» неудачен, по- 
скольку грамматик «с бесконечным числом состоя- 
ний» не бывает. Английский термин на самом деле 
шире по значению, чем его русская калька: он 
означает нёчто вроде «грамматика, имеющая оп- 
ределенное отношение к конечному числу состоя- 
ний [чего-то], причем имеется в виду Ноце зе 
аи{ота+ф0оп, т.е. эквивалентный грамматике автомат 
с конечным числом состояний (конечный автомат). 
Именно этой эквивалентностью и объясняется пред- 
лагаемый термин; совсем точным названием было бы 
«конечно-автоматная грамматика». См. стр. 69 и сл. 

Автоматный язык (А-язык) — Ноце з{а%е ]ап- 
сиасе. Калька «язык с конечным числом состояний» 
неприемлема, так как языки в смысле теории фор- 
мальных грамматик вообще не могут иметь «состоя- 
ний». Как и в предыдущем случае, английский тер- 
мин означает, собственно говоря, «язык, имеющий 
определенное отношение к конечному числу состоя- 
ний [чего-то]», т. е. конечного автомата. Точнее бы- 
ло бы говорить о конечно-автоматных языках, 
ср. выше. См. стр. 70. 

Взаимозамещаемость — шиба|1 забзийкаьИиу/ 
АпфегсВапоеа у. См. стр. 166. 

Вспомогательный символ — поп-(еги ща! зушЪо]. 

Употребляется также термин «нетерминальный 
символ». См. стр. 37. 

Вепомогательный словарь — поп-йегл! та] уоса- 
Багу. Употребляется также термин «нетерминаль- 
ный словарь». См. стр. 37. 

Вывод — дег1уа оп. Употребляемый иногда тер- 
мин «деривация» абсолютно неприемлем, так как 
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соответствующее понятие давно обозначается в рус- 
ской математической литературе именно термином 
«вывод». Кроме того, за словом «деривация» в линг- 
вистике уже закрепился другой смысл: аффиксаль- 
ное словообразование. См. стр. 43. 

Выводимость — депуа у. См. стр. 45. 
Главная категория — шаш сафесоту. См. стр. 
125. 

Грамматика — оташшаг. См. стр. 253. 

Грамматика — непосредственно — составляющих 
(НС-грамматика) — рЬгазе эётасате сташтаг. Рус- 
ская калька «фразово-структурная грамматика» 
неприемлема, поскольку англ. р№газе означает 
именно «составляющая» (или «словосочетание»), но 
ни в коем случае не «фраза». Кроме того, термины 
«непосредственно составляющие», «анализ по непо- 
средственно составляющим» и т. п. давно приняты 
в лингвистике. Они возникли как буквальный пере- 
вод английского термина !ттед1а4е сопз 4 таец& 
(апа1у513, арргоасв, ЧезсрИоп). По-видимому, 
удобнее было бы говорить просто о грамматике со- 
ставляющих, опуская определение «непосредствен- 
но», поскольку никаких других составляющих не 
бывает. Однако в связи с общеупотребительностью 
термина «непосредственно составляющие» мы пред- 
почли его сохранить. См. стр. 54. 

Грамматика с ограниченным замедлением — см. 
стр. 119. 

Грамматика с ограниченным растяжением — 
см. стр. 105. 

Дегуманизация — деБатап12аНоп. См. стр. 9. 

Деривация — см. Вывод. 

Замещаемость — зарзйица5Ииу. См. стр. 166. 

Категориальная грамматика — саберог1а! статиааг. 
См. стр. 122. 

Категория — сайесогу. См. стр. 124—125. 

Конечно характеризуемый язык — см. стр. 170. 

Контекстно-свободная грамматика (ЁС-грамма- 
тика) — сопех(-Ё№ее ргаттаг/з1тр]е р№газе зегасвате 
оташтаг. Используется также термин «бесконтек- 
стная грамматика» (представляющий собой б60- 
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лее удачный в стилистическом отношении перевод 
английского выражения). См. стр. 63. 

Контекстно-свободное правило — сот{ех{-Ёгее ге. 
См. стр. 63. 

Контекстно-связанная грамматика — сощех{- 
Боппд/сол{ех{-дерепд4еп/сот{ех{-зеп1 уе  сташтаг. 
См. стр. 63. 

Контекстно-связанное правило — соп4ех4-Бопп9/ 
соп4ех{-ерепдеп /соп(ех{(-зеп уе гщше. См. стр. 
63. 

Конфигурационная характеристика — см. стр. 
169. 

Конфигурация — см. стр. 166—168. 

Магазин — ризй-до\уп 5$оге. См. стр. 144. 

Начальный символ — 111а| зушЬо]. См. стр. 
38. 

Нетерминальный символ — см. Вспомогательный 
символ. 

Нетерминальный словарь — см. Вспомогатель- 
ный словарь. 

НС-грамматика — см. Грамматика  непосредет- 
венно составляющих. 

Основной/терминальный символ — {егшша| зут- 
Бо]. См. стр. 36. 

Основной/терминальный словарь — {египа] уо- 
сабагу. См. стр. 35. 

Правила подетановки — темтю тез. Часто 
применяемый русский термин «правила переписы- 
вания», калькирующий англ. теутИте гез, со- 
вершенно неприемлем в силу омонимичности глаго- 
ла «переписывать»: англ. сору «переписывать (без 
изменения)» и англ. гешгйе «переписывать (заново, 
быть может, в ином виде)». Термин «переписывать» 
приходится использовать в теории грамматик в 
смысле англ. сору — когда имеется в виду перенос 
символа из одной цепочки в другую без изменения. 
Кроме того, термин «правила подстановки» давно 
используется в русской математической литературе 
именно в нужном смысле. См. стр. 38. 

Предсказуемостный/предиктивный анализатор — 
рге41сйуе апа|у7ег. См. стр. 136. 
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- Приписывающая функция — аззритепт №юпс- 
оп. См. стр. 175. 

Сигнализирующая функция временная — см. 
стр. 4116. 

Сигнализирующая функция емкостная — см. стр. 
119. 

Словарь — УосаБч]ату. См. также Основной сло- 
варь, Вспомогательный словарь. Наряду с терми- 
ном «словарь» иногда употребляется также термин 
«алфавит» (англ. а!рБаЪе). 

Сокращение — сапсеПа Йоп. См. стр. 125. 

Составляющая — сопз бет /рЬтазе. См. стр. 164 
и сл. 

Цепочка — зтшо. Употребление в данном смыс- 
ле термина «фраза», встречающееся в некоторых 
работах, является неудачным, поскольку в русской 
лингвистической литературе фразами называют не 
любые цепочки символов, а только некоторые, имею- 
щие определенное строение (-— предложения). См. 
стр. 253. 

Циклическое правило — гесагзуе гШе. Термин 
«рекурсивное правило» представляется неудобным, 
поскольку за словом «рекурсивный» в математике 
закрепилось другое значение. См. стр. 57. 

Эквивалентность грамматик — см. стр. 47. 

Элементарная категория — риш Шуе  саероту. 
См. стр. 124. 

Язык © конечным числом — состояний — НпЦе 
зф6афе 1апспасе — см. Автоматный язык. 

Язык, порождаемый грамматикой, — См. стр. 47. 


Литература 


Абаев В. И. Лингвистический модернизм как дегума- 
низация науки о языке.— «Вопросы языкознания», 
1965, № 3, 22—43. В 

А пресян Ю. Д. Современные методы изучения значе- 
ний и некоторые проблемы структурной лингвистики. 
В кн.: «Проблемы структурной лингвистики», М., 1963. 

А пресян Ю.Д. Идеи и методы современной структур- 
ной лингвистики (краткий очерк), М., 19 

А рсентьева Н. Г. О двух способах порождения пред- 
ложений русского языка.— В с6б.: «Проблемы кибер- 
нетики», вып. 14, 1965, 189—248. 

Бар-Хиллел И. Разрешающие процедуры для струк- 
туры естественных языков.— В кн.: «Математическая 
лингвистика», М., 1964, 108—124. 

Бар-Хиллел И. Некоторые новые результаты в тео- 
ретической лингвистике.— В кн.: «Математическая ло- 
гика и ее применения», М., 1965, 273—280. 

Гильберт Д., Аккерман В. Основы теоретичес- 

кой логики, М., 4947. 

Гладкий А. В.  Конфигурационные — характеристики 
языков.— В с6б.: «Проблемы кибернетики», вып. 410, 
1963 (а), 251—260. 

Гладкий А. В. Грамматики с линейной памятью.— 
«Алгебра и логика», 1963 (6), 2, №5, 43—55. 

Гладкий А. В. Алгоритм распознавания конфигура- 
ций для класса автоматных языков. В сб.: «Проблемы 
кибернетики», вып. 12, 1964 (а), 243—245. 

Гладкий А. В. Алгоритмическая природа инвариант- 
ных свойств грамматик непосредственно составляю- 
щих.— «Алгебра и логика», 1964 (6), 3, №2, 17—31. 

ГладкийА. В. О сложности вывода в грамматиках не- 

‚посредственно составляющих. — «Алгебра и логика», 
1964(в), 3, 5—6, 29—44. 

Гладкий А. В. Некоторые алгоритмические проблемы 
для контекстно-свободных грамматик.— «Алгебра и ло- 
гика», 1965, 4, № 3, 3—13. 

Гладкий А. В. Лекции по математической лингвистике 
для студентов НГУ, Новосибирск, Изд. НГУ, 1966. 

Гладкий А. В., Рыбакова М. В., Шедь-. 
ко Т. И. Схема семантического языка-посредника 
для записи математических текстов, М., 1964 (ВИНИТИ 
АН СССР. Доклады на конференции, вын. 410). 


Литерапиура 189 


Глисон Г. Введение в дескриптивную лингвистику, М.., 
1959. 

Ж олковский А. К., Леонтьева Н.Н., Мар- 
темьянов Ю. С. О привципиальном использо- 
вании смысла при машинном переводе.— В кн.: «Ма- 
шинный перевод», Труды ИТМ и ВТ, выш. 2, М., 19614, 
17—46. 

Жолковский А.К. Мельчук И.А. О семан- 
тическом синтезе.— В сб.: «Проблемы кибернетики», 

. вып. 49, 1967, 177—238. 

Зализняк А. А. Русское именное словоизменение, М., 
1967. 

Зализняк А. А. Синтаксические категории имени, 1969 
(в печати). 

Ингве В. Гипотеза глубины.— В кн.: «Мовое в лингви- 

стике», вып. ГУ, М., 1965, 126—138. 

Кузнецов А. В., Падучева Е. В. Ермолае- 
ва Н. М. Об информационном языке для геометрии 
и алгоритме перевода с русского языка на информаци- 
онный.—В кн.: «Лингвистические исследования по ма- 
шинному переводу, вып. 2, М., 1961, 40—73. См. также 
сб. «Машинный перевод и прикладная лингвистика», 
вып. 5, 1964; 3—21; вып. 6, 1961, 9—18. 

Кулагина О.С. Об одном способе определения грам- 
матических понятий на базе теории множеств.—В сб.: 
«Проблемы кибернетики», вып. 1, 1958, 203—214. 

Ламбек И. Математическое исследование структуры 
предложений.— В кн.: «Математическая лингвистика», 
М., 1964, 47—68. 

Ломковская М. В. Исчисление, порождающее ядер- 
ные русские предложения.— «Научно-техническая 
информация», 1965, № 7, 35—41 (часть Г); 1965, № 9, 
37—40 (часть 11); 1966, № 11, 56—65 (часть 1). 

Лучкин В.Д. О рангах конфигураций контекстно-сво- 
бодных языков.— «Алгебра и логика», 1966, 5, № 3, 
59—70. 

Маркус С. Грамматический род и его логическая мо- 
дель.— В кн.: «Математическая лингвистика», М., 1964. 

Мастерман М. Изучение семантической структуры 
текста для машинного перевода с помощью языка-по- 
средника.— В кн.: «Математическая лингвистика», М., 
1964, 177—213. 

Мельчук И.А. Автоматический анализ текстов (на 
материале русского языка).—В кн.: «Славянское язы- 
кознание» (Доклады советской делегации. У Междуна- 
родный съезд славистов), М., 1963, 477—509. 

Мельчук И. А. Автоматический синтаксический анализ, 
Г, Новосибирск, 1964. 

Мельчук И. А. Порядок слов при автоматическом син- 
тезе русского текста (Предварительное сообщение).—- 
«Научно-техническая информация», 1965, №12, 36—41. 


190 Литература 


Падучева Е. В. Некоторые вопросы перевода с ин- 
формационно-логического языка на русский.— «На- 
учно-техническая информация», 1964 (а), № 2, 20—27. 

Падучева Е. В. О способах представления синтакси- 
ческой структуры предложения.— «Вопросы ` языко- 
знания», 4964 (6), №2, 99—113. — 

Падучева Е. В. Опыт логического анализа значения 
союза или.— «Философские науки. НДВШЬ, 1964 (в), 
№ 6, 145—148. 

Падучева Е. В. Синтез сложных предложений с одно- 
значной синтаксической структурой (при переводе с 
информационно-логического языка на русский).— 
«Научно-техническая информация», 1964(г), № 6, 43—49. 

Падучева Е. В. О связях глубины по Ингве со струк- 
турой дерева подчинений.— «Научно-техническая ин- 
формация», 1967, № 6, 38—43. 

Паркер- Роудс А. Ф. О последних работах в обла- 
сти машипного перевода методом тезауруса и языка- 
посредника.— В кн.: «Математическая лингвистика», 
М., 1964, 229—245. 

Ревзин И. И. Метод моделирования и типология сла- 
вянских языков, М., 1967. 

Сухотин Б. В. Экспериментальное выделение классов 
букв с помощью электронной вычислительной маши- 
ны.— В кн.: «Проблемы структурной лингвистики», 
М., 1962, 198—206. 

Сухотин Б. В. Алгоритмы лингвистической дешифров- 
ки.— В кн.: «Проблемы структурной лингвистики», 
М., 1963, 75—101. 

Тарский А. Введение в логику и методологию дедук- 
тивных наук, М., 1948. 

Трахтенброт Б. А. Алгоритмы и машинное решение 
задач, М., 1960. 

Успенский В. А. Одна модель для понятия фонемы.— 
«Вопросы языкознания», 1964, № 6, 39—5$3. 

Хомский Н. Синтаксические структуры.—В кн.: «Но- 
вое в лингвистике», вып. [], 1962, 412—527. 

Хомский Н. Логические основы лингвистической тео- 

ии.— В кн.: «Новое в лингвистике», вып. ГУ, 1965(а), 
465—575. 

Хомский Н. О понятии «правило грамматики».— В кн.: 
«Новое в липгвистике», вып. ГУ, 1965 (6), 34—65. 
Хомский Н. Формальные свойства грамматик.—В кн.: 
«Кибернетический сборник». Новая серия, вып. 2, 

1966, 121—230. 

Хомский Н., Миллер Дж. Введение в формальный 
анализ естественных языков.—В кн.: «Кибернетичес- 
кий сборник». Новая серия, вып. 14, 1965, 229—290. 

Хэррис 3. С. Совместная встречаемость и трансформа- 
ция в языковой структуре.—-В кн.: «Новое в лингви- 
стике», вып. 1, 1962, 528—636. 


Литература 194 


Ш рейдер Ю. А. Характеристики сложности структуры 
текста. «Научно-техническая информация», 1966, 
№ 7, 34—41. 

Ваг-Н111е1 У. *) А диа$1-агИАтейса] поба Йоп Юг зуба Ис 
Чезсг1рИоп.— «Гапвиасе», 1953, 29, № 1, 47—58. 

Ваг-Н11]1е1 У. Зоше Ипри1зИс орзфаез 10 тшасрше 
{тапаНоп.— [1. «Адуапсез ш сотрщегз», 01. 1, М. 
У.— Гоп@оп, 1960, 146—157. 

Ваг-Н!111!е]1 У., Са1Ё!шап С. бБаштт Е. Оп 
саберог1а] ап рЬтазе-згасвате рташтатз.— «ВиЦейп 
оЁ {№е ВезеагсЬ Соиле] оё [5гае]», 1960, 9Е, 4—16. 

Ваг-Н1!1е| У., БВаш:тг Е. ЕшиИе зе 1апепасез: 
фоттпа] гергезел{аМоп ап@ адечиасу ртоЪ]етз.— «В1- 
1ей пд оЁ {Ме Везеагсь Соипс оё 1згае», 1960, 8Е, № 3, 
155—166. 

Ваг-Н11!1е1 У., Рег|ез М., Звашуг Е. Оп юг- 
ша] ргорегИез оЁ заре рЬгазе эёгасвиге рстатллагз.— 
«РецзсЬг Гаг РВопейк, ЭргасЬ\1зепзсВай ип Кот- 
шип айИопзогзебипе», 1961, 14, №2, 143—172. 

Вотгом ЮО. Ц. БущасЫе апа|уз1$ оЁ ЕпёИзЬ Бу сотри- 
1ег — а зуеу.— ш. «АЕГРЗ сощегепсе ргосее@1трз», 
24, Ва] тоге — Гопдоп, 1963, 365—387. 

СВагпеу Е. К. Оп {№е зетапис пцегргеа оп оЁ Нпеи1$ с 
еп Иез {1аф РапсЯоп этисбигаЦу. Тедаттебоп (Маф. 
рвуз1са] ]аЪ. Рарег 8), 1961. 

СВагпеу- Е. К. Оп \е ргоШеште о{ зеп(епсе зуповуту.— 
«Опагет]у ргостезз герог», № 66 (Мазз. 1156. оЁ цес\- 
по]ору), СатЬх1Асе (Мазз.), 1962, 289—293. 

СВагпеу Е. К. Этасихга|] зетапИс {оппдайолз ог а 
{Веогу ой шеапшре, СЫсаро, 1966. 

Раут1ез М. СотрщизаЬ ИУ апд иозо]уаБИиу, М. У., 1958. 

Ровшапп К. 7х бешацИК ипд Ебуто]оре 4ег зргасЬИ- 
свеп Паг%еПЦиое ег 4уа91зсВеп Еошкотеп.— «54 1- 
ит репега]е», 1966, 19, №7, 398—401. 

Егецеп {В а1 Н. 1[1МС058. Безе оЁ а ]апеиаре Гог 
созш!с пегсоигзе, Рагё 1, Ашзег4ат, 1960. 

Нагг! Е д. 9. Этасбага! Ппеи1$Ис$, СЫсаво — Гопдоп, 
1963. 

Науз р. Сгоиршр ап@ дерепдепсу {Веог1ез.— Ти. «Ргосее 1103 
оЁ {№е Майопа] Зушрозщм оп Масбше Тгадайоп», 
Еп]емоо@ СПНз (М. Ф.), 1961, 258—266. 

Науз О. С. Ащюощшайс ]априаре дафа ргосеззтр.— ш.«Сош- 
рибйег аррПсаЙопз ш Бевау!ога| зс1епсез», Еп]е\моо4 
СОз (№. Р.), 1962, 394—424. 

Науз ШП. Оерепдепсу Шеоту: а огтаПзайоп ап зоте оЪ- 
зегуаНоп$.— «Гапеиаре», 1964, 64, № 4. 


*) Указанные здесь работы Бар-Хиллела и его соавторов 
перепечатаны в книге У. Ваг-НШе| «Г.апгиаее ап 1РЮюгтай- 
оп», Веадше (Мазз.) ес., 1964. 


192 Литература 


Капо 5. Те шиИр1е-ра зужасИс апа[утег ог Еп21136.— 
«Ма ешайса! Ппру1$Мс$ ап ащоштайс 1тапз|а Мол» 
(Сопрщайоп 1аБ. Нагуаг4 иу.), Веротё № №Е-9, 
у0}]. 1, СатЬч@ре (Мазз.), 1963. 

К ипо 5., Ос! псег А. бущасис эхисихе апд атЬ!- 
сиЦу оЁ Епе1$В.— п: «АЕГР$ ргосеед1тез о{ {Ве КаП 
]01% сошрщег сопегепсе...», 24, Вайипоте — Гопдоп, 
1963, 397—418. 

М агсиз 5. Ге сепге ртатта са] еф зоп шодве ]ор1ие.— 
«СаШегз 4е Ппри1зИдие Шбог1ие её аррИдибе», 1962, 
1, 103—122. 

М агсиз 5. Модёез па ётайачез ропг ]а са&брое ргат- 
шайса]е Чи саз.— «Веуце де ша 6щтайаиез ригез её 
арр!дибез, 1963, 3, №4, 585—610. 

Меп4е]|зоп Е. ШшиодасИоп 40 шаТетайса] 1021е, Ргш- 
сеоп — Тогопфо — Мех УотК — Гопдоп, 1964. 
Моуофтпу М. ОБег епаНев сВагакег1$етЬагеп Зргасвен.— 

«рву ргтодоуёа. ак. иглу. у Вгоё», 1965, № 10, 495— 


Р]|абЬ У. Т. МафеютайИса1 11013 с5.— Г: «Тгеп@з ш Епго- 
реап ап Ашег!сап Нпри151с$, 1930—1960...», Обтес— 
Апб\егреп, 1961, 21—57. 

Р|1аёЪЬ У. Г. МшШире-ра\ зуасИс апа1у$1$ о Визчап.— 
«Ма Мета са] И121$с$ ап ацботайс гала оп» 
(Сошрщаймоп ]аЪ. Нагуага иту.), Верогё № №Е-12, 
СатЬт19се (Мазз.), 1963. 

Розфа] Р. М. Гиацайопз оЁ р№газе эгасбаге отаттпаг$.— 
То; «ТВе этисбаге оЁ ]Лаприаре. Веа 41103 11 фе рАПозорБу 
оЁ ]априаре», Епо1емоо4 СПЁз (М. Т.), 1964, 437—451. 

Ве! И. ел БасЬ Н. ЕМетегз оЁ зутЪоЙе 1ор1е, М. У.., 

В иззе] В. Ап шашту 1110 теашше апд ти, М. У., 1940. 

Оп1те У. У. Уог@ ап@ оБ]есё, Мех Уотк — Г.опдоп, 1960. 

Оц1те У. У. Горе аз а зоитсе оё зущасИса] 1315848.— 
Тп: «Эгисите оЁ 1апсиасе ап@ 165 шаТета са] азресёз», 
Ргоу!4епсе (ВБоде 1[5$]ап9а), 1964, 1—5. 

Тезптёге Г. Е\6 тез 4е зущахе эгисбигае, Р., 1959. 

Тозь Г. У. ЗущасИс 1тапзаИоп, ТЬе Насте, 1965. 

Уагра ШП. Упоуе’з Вуро\Вез13з ап@ зоше ргоШетз оЁ {Ве 
шесват1са] апа1уз15.— «Сошршайопа] [1121015 с$», 
1964, ПП, 47—74. . 

У е1пгетсЬ ЦП. Оп \№е зетап Ис Зее оё 1апеоаре.— 
ш: «Ошуегза1з оЁ ]апеиаре», Е. 7. Н. Сгеепфеге, СатЪ- 
г14се (Мазз.), 1963, 114—171. 

Упруе У. Н. А тоде| ап4 а ВуроМез1з фог ]априаре зтист- 
ге.— «Ргосее41пез оЁ Ашег1сап рВу1озор1са| зослефу», 
1960, 104, № 5, 444—466. 

Упруе У.Н. Вапдош вепегайор оЁ ЕпёПзЬ зещепсез, 
Тед41тейюп (Майопа|1 рВуз!са] 1аБогафогу. Рарет 6), 
1961. 


[2 ируяан] 


9 9 


ХИ ЙА АП [АГА]! 
—14\$1 
[%\ ФИФ 
и [Д/Ф] 
«в9-внэ» 


«Но» 


ччвлиь тэ4Ного 


х 
[У/АУхИ 


ее м еГяан] 
о 9 


хи 7Их ЛАЗАШАИАИХ 
—#ж\Ф 
[ФФ 
и [4 Ф| 
«нЭ-Во» 


«нэ» 


онелевепен 


иже () 


АБЯгэм ‘и ‘иинШен] 'у 


д 
ИУ 


"ноу 


но 8 
*1Э 8 
но () 
“ноя 
нос 
но 9 


вноаю 


а 


97 
<ст 
НУ 
967 
85 


85 


"а 


